杨卫丽
- 作品数:1 被引量:5H指数:1
- 供职机构:中国国防科技信息中心更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 海量信息异常检测问题的异常概率排序算法被引量:5
- 2011年
- 针对异常检测算法速度慢、精度低、稳定性差等问题,提出了一种通过异常概率排序提取异常点的算法(OAP).由于异常点相对正常点更容易通过对数据空间的均匀分割而孤立出来,所以OAP通过数据点在均匀N叉分割树中的孤立深度估算异常概率的大小,从而得到异常概率的排序,最终构造由k个异常概率最大的点组成的列表,列表中的数据就是所求的异常点.OAP不需要距离或密度的计算,复杂度被降到O(n)级.实验结果表明,对于规模线性增加的海量实验数据集,OAP消耗的CPU时间也线性增加;相对iForest算法,其速度提高了30倍,精度提高了20%~30%,且同一数据集上的多次实验结果一致,稳定性高.
- 陈刚蔡远利穆静杨卫丽
- 关键词:数据挖掘异常检测