陈衡岳
- 作品数:3 被引量:12H指数:2
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于引力概念的聚类质量评估算法被引量:3
- 2007年
- 为了定量分析聚类算法的聚类结果,提出了基于引力概念的聚类质量评估算法.该算法将数据空间中的数据点视为带有单位质量的质点,通过分析聚类结果中数据点之间的引力关系来评估聚类结果的质量.在一个聚类结果中,各类中的数据点之间引力大并且噪音数据受到的引力小,这样的聚类结果视为质量较高的聚类结果.相反,如果类中数据间的引力较小而噪音数据所受到的引力较大,这样的聚类结果就是一个质量不高的聚类结果.在几个不同的数据集上,对算法的有效性和高效性进行了测试.实验结果表明,该算法能在极短的响应时间内得到聚类结果评估值,正确地反映聚类结果的优劣.提出的算法可以引导聚类方法自动发现最佳聚类结果而无需人工干预.
- 于勇前赵相国陈衡岳王国仁
- 关键词:聚类引力聚类算法数据挖掘
- 一种基于密度单元的自扩展聚类算法被引量:9
- 2006年
- 提出一种高效的基于密度单元的自扩展聚类算法SECDU.首先将数据空间等分为若干个密度单元,再根据数据点的位置将其划分到所属的密度单元中,然后针对密度单元进行聚类.聚类首先产生在数据最密集的区域,然后向周围低密度区域延伸.聚类在延伸的过程中体积逐渐增大,密度逐渐减小,直到聚类的密度达到一个事先规定的限度时为止.算法在保留原有数据分布特性的前提下利用密度单元对数据进行压缩,并在保证具有较好效果的前提下大幅度地提高了聚类的速度.
- 于勇前赵相国王国仁陈衡岳
- 关键词:聚类分析聚类算法
- 一种基于密度单元的聚类算法
- 随着信息技术的迅速发展,需要分析和管理的数据量迅速增大,这种趋势必然地渗透到了聚类分析领域。聚类分析是数据挖掘技术中重要的组成部分,从技术角度讲,它的主要目的是将数据空间中的数据点划分到若干个类中,其中将距离相近的数据点...
- 陈衡岳于勇前王国仁乔百友
- 关键词:聚类分析数据空间
- 文献传递