宋国杰 作品数:56 被引量:172 H指数:7 供职机构: 北京大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 交通运输工程 文化科学 电子电信 更多>>
数据流中频繁模式的评估与维护 1引言模式挖掘是数据挖掘的一个重要研究分支,在冰川查询、关联规则、冰川数据方和路由管理和IP包计数等领域都有着十分广泛的应用。结合数据流的特性,文[1,2]给出了对数据流中频繁项进行计数的算法。文[1]引入新的Count... 宋国杰 王腾蛟 唐世渭 杨冬青关键词:SAMPLE 文献传递 面向移动社会网络的用户年龄与性别特征识别 被引量:2 2016年 移动社会网络数据存在网络结构复杂,节点间标签相互影响,包含交互信息、位置信息等多种复杂信息等特点,给识别用户的特征带来了许多挑战。针对这些挑战,通过分析一个真实的移动网络数据,利用统计学分析提取出已标记的不同特征用户间的差异,并利用这些差异,借助关系马尔可夫网络建立预测模型对未标记用户的年龄与性别进行特征识别。分析表明,不同年龄、性别的用户在不同时段的通话概率、通话熵,位置信息的分布、离散性,在社会网络中的集聚程度,以及相互之间二元、三元的交互频率方面都存在明显的差异。利用这些特征,提出了利用二元和三元交互的关系基团模板,结合用户自身的时间空间特征,通过关系马尔可夫网络计算用户特征的全联合分布概率,进而以此推断用户的年龄与性别的方法。经过实验分析,利用关系马尔可夫网络、用户时空信息和用户交互的关系基团的分类方法相较于传统的C4.5决策树、随机森林、Logistic回归和Naive Bayes等分类方法,能够提高最高约8%的预测准确率。 李源昊 陆平 吴一凡 韦薇 宋国杰关键词:社会网络分析 一种无线通信环境中用户移动模式的挖掘算法 被引量:8 2002年 发现无线通信环境中用户的移动模式是移动对象管理中的一个关键问题.提出一种快速挖掘该模式的算法SAM(split and merge),用来挖掘移动对象所产生有序数据集中潜在的移动模式,从而为移动对象管理提供服务.该算法将自底向上搜索和自顶向下过滤技术相结合,采用图存储压缩数据集方法,利用非频繁项集分解子图和频繁长模式过滤数据集相结合的技术,大大减少了迭代次数,降低了CPU时间.最后给出了算法性能比较和算法分析.结果表明,该算法是有效的. 宋国杰 唐世渭 杨冬青 王腾蛟 叶恒强关键词:无线通信 数据挖掘 最大频繁项集 移动通信 一种基于局部加权学习的自适应交通流预测机制 被引量:1 2010年 结合交通流的特征,提出了一种自适应的交通流预测机制。首先根据训练数据特点,按三相交通流理论对交通状态进行分类,从每个分类对应的训练数据集内提取相应的最佳邻域。在基于局部线性回归模型的预测中,根据邻域中数据点所处状态分别选择相应局部模型进行预测,最终预测结果为各局部模型预测值的加权平均。根据各模型误差确定当前数据所处状态,增量加入训练数据集。基于真实交通数据的实验证实该方法能够有效提高预测的准确率。 帅猛 韩磊 谢昆青 宋国杰 马修军 陈冠华关键词:自适应 交通流预测 一种面向移动社会网络的用户出行预测方法 本发明公布了一种面向移动社会网络的用户出行预测方法,通过计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括步骤:进行数据预处理;计算得到用户出行的时空熵;根... 宋国杰 王韵文献传递 北京大学“数据结构与算法”教学设计 被引量:21 2008年 本文介绍了“数据结构与算法”课程的教学理念、教学设计、教学方法和手段的改革与创新。根据ACM/IEEE CC2005和教育部计算机教指委CCC2006学科规范,从问题求解出发,在基础理论、抽象和设计的三个层次组织课程内容体系,特别强调以知识与能力培养为导向的教学目标和定位。 张铭 赵海燕 王腾蛟 宋国杰 高军关键词:数据结构 教学体系 基于实化视图树的实视图动态选择 端缓存对于提高用户查询性能、减少服务器和客户端之间的数据传输开销具有重要作用,缓存中的实视图集合需要根据用户查询进行动态调整。已有的缓存管理策略,由于没有考虑用户在进行OLAP分析时的数据访问特性,因此在处理实视图动态选... 林子雨 杨冬青 王腾蛟 宋国杰关键词:数据仓库 多维数据 缓存 一种基于高速公路联网收费数据的交通流估计方法 本发明公布了一种基于高速公路联网收费数据的交通流估计方法,所述方法基于历史高速公路联网收费数据,首先估计得到历史上不同时段路网上各个路段的交通流;再分析得到在过去若干时间段内路网各个进口交通流的分配模式;然后基于当前所有... 宋国杰 谢昆青 聂鑫维文献传递 基于网络子图表示的铁路运输安全事故分类方法 2020年 为解决铁路货物运输中的安全事故分类问题,本文提出了一种面向子图表示的铁路运输事故分类方法。运用网络表示学习方法对货运记录进行网络构建,表示出货运记录及记录之间的相似性,通过图卷积神经网络将货运记录网络结构中的节点信息和边信息进行融合,通过对节点相似度的利用,提升货物运输事故的分类判断准确度。实际数据实验中,将事故类型分为4类,抽象成为一个四分类问题,实验结果表明决策树的F1值稳定在66%,本文提出的方法相比决策树算法F1值提高约9个百分点,达到75.1%。 林增跃 朱涛 王鹏 宋国杰关键词:铁路运输安全 子图 面向实时短时交通流预测的过程神经元网络建模 被引量:9 2009年 为了充分利用交通流的时空过程特性,进行交通流的实时预测,将过程神经元网络和数据流在线学习技术引入到短时交通流预测中。充分考虑交通流的日周期、周周期等内在特性,结合过程神经元网络和小波变换,实现对历史数据的多尺度过程特征处理。构建了路网整体预测过程神经元网络模型,并采用主成分分析方法,利用交通流空间相似性的影响对模型进行优化。基于Harr小波技术提出具有自适应和实时性预测特征的在线学习算法。试验结果表明:该模型的预测准确性优于普通神经网络,平均百分比相对误差降低6%~8%,预测时间至少降低67%,具有较高的性能,能满足短时交通流实时预测的需求。 宋国杰 胡程 谢昆青 彭锐关键词:交通预测 短时交通流 过程神经元网络