国家自然科学基金(60874082)
- 作品数:2 被引量:5H指数:2
- 相关作者:谢昆青张平董新品宋国杰马秀莉更多>>
- 相关机构:北京大学山西省高速公路管理局更多>>
- 发文基金:国家自然科学基金山西省交通建设科技项目北京市自然科学基金更多>>
- 相关领域:交通运输工程机械工程自动化与计算机技术更多>>
- 基于OD稳定模式的高速公路出口流量预测方法研究被引量:3
- 2012年
- 从高速公路车辆出入口数据中可以直接提取路网中车辆的OD信息,这些信息在一定程度上反映出车辆时空上的运行状态,更可以通过这类数据对高速公路出口流量的趋势做出合理有效地预测.本研究从真实数据出发,对交通路网中车辆OD的稳定性进行了分析,并以此为指导,将所得到的领域知识加入到常规的预测方法中,提出了一套基于OD稳定模式的高速公路出口流量预测方法.主要贡献包括:①提出了信息熵的概念,以刻画高速公路车辆OD的规律性;②提出了基于OD的稳定模式的出口流量预测方法;③在大量真实的数据上进行了实验分析.
- 张平张明欣宋国杰董新品谢昆青
- 关键词:信息技术交通流预测信息熵
- 一种有效的基于生活熵的移动用户分类算法
- 从海量移动用户通话记录中,根据用户的行为模式对用户进行分类挖掘.主要贡献包括:1)提出了生活熵的概念,用以刻画移动用户行为的规律性;2)提出基于生活熵的个人用户行为的分类算法;3)在大量真实移动数据集上进行了实验分析.利...
- 谭钧元宋国杰谢昆青黄顺平
- 文献传递
- 面向高维数据的低冗余top-k异常点发现方法被引量:2
- 2010年
- 异常发现是数据挖掘领域的一类重要任务.针对高维对象的异常度量问题和异常点集合的冗余问题,提出了一种新的面向高维数据的异常点发现方法.该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含不同类型属性的高维数据.为了解决top-k异常点集合中的冗余问题,提出了低冗余top-k异常点的概念.由于精确计算低冗余的top-k异常点是NP-hard问题,设计了计算近似低冗余的top-k异常点的启发式方法k-AnomaliesHD算法.从在真实和人工数据集上的实验结果可以看出,该方法具有较好的扩展性;而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式.
- 陈冠华马秀莉杨冬青唐世渭帅猛谢昆青
- 关键词:数据挖掘异常检测高维数据