陈冠华
- 作品数:6 被引量:14H指数:2
- 供职机构:北京大学信息科学技术学院智能科学系更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- SDML:基于空间数据库的空间数据挖掘语言被引量:11
- 2004年
- 设计了一种基于空间数据库的空间数据挖掘语言SDML。根据SDML操作的对象以及挖掘过程的不同阶段 ,SDML语言可以分为视图操纵语言和模型操纵语言 ,分别负责对于数据挖掘视图和模型的操作。详细阐述了SDML的设计思想及其设计方案 ,针对空间泛化和空间关联这两个典型的空间数据挖掘问题 。
- 高韬谢昆青马修军陈冠华
- 关键词:空间数据挖掘数据挖掘语言数据挖掘模型
- 面向高维数据的低冗余top-k异常点发现方法被引量:2
- 2010年
- 异常发现是数据挖掘领域的一类重要任务.针对高维对象的异常度量问题和异常点集合的冗余问题,提出了一种新的面向高维数据的异常点发现方法.该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含不同类型属性的高维数据.为了解决top-k异常点集合中的冗余问题,提出了低冗余top-k异常点的概念.由于精确计算低冗余的top-k异常点是NP-hard问题,设计了计算近似低冗余的top-k异常点的启发式方法k-AnomaliesHD算法.从在真实和人工数据集上的实验结果可以看出,该方法具有较好的扩展性;而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式.
- 陈冠华马秀莉杨冬青唐世渭帅猛谢昆青
- 关键词:数据挖掘异常检测高维数据
- 一种基于局部加权学习的自适应交通流预测机制被引量:1
- 2010年
- 结合交通流的特征,提出了一种自适应的交通流预测机制。首先根据训练数据特点,按三相交通流理论对交通状态进行分类,从每个分类对应的训练数据集内提取相应的最佳邻域。在基于局部线性回归模型的预测中,根据邻域中数据点所处状态分别选择相应局部模型进行预测,最终预测结果为各局部模型预测值的加权平均。根据各模型误差确定当前数据所处状态,增量加入训练数据集。基于真实交通数据的实验证实该方法能够有效提高预测的准确率。
- 帅猛韩磊谢昆青宋国杰马修军陈冠华
- 关键词:自适应交通流预测
- 面向高维数据的低冗余Top-k异常点发现方法
- 异常发现是数据挖掘领域的一类重要任务,一直以来受到研究人员的广泛关注。针对高维对象的异常度量问题和异常点集合的冗余问题,本文提出了一种新的面向高维数据的异常点发现方法。该方法通过采用高维数据的二部图表示,以高维对象的压缩...
- 陈冠华马秀莉杨冬青唐世渭帅猛
- 关键词:高维数据
- 文献传递
- 面向高维数据的概要分析方法研究
- 从知识发现概念的最初提出开始,数据挖掘理论和技术在短短十年左右的时间里得到了迅速发展。其中,数据概要分析(data summarization)是一类重要的描述性数据挖掘任务,它的目标在于通过发现数据的分布特征或典型模式...
- 陈冠华
- 关键词:数据挖掘高维数据
- 面向高维数据的低冗余Top-k异常点发现方法
- 异常发现是数据挖掘领域的一类重要任务,一直以来受到研究人员的广泛关注。针对高维对象的异常度量问题和异常点集合的冗余问题,本文提出了一种新的面向高维数据的异常点发现方法。该方法通过采用高维数据的二部图表示,以高维对象的压缩...
- 陈冠华马秀莉杨冬青唐世渭帅猛
- 关键词:异常检测高维数据
- 文献传递