王彬
- 作品数:2 被引量:18H指数:2
- 供职机构:解放军理工大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的K-Means算法被引量:14
- 2014年
- 针对典型K-Means算法随机选取初始中心点导致的算法迭代次数过多的问题,采取数据分段方法,将数据点根据距离分成k段,在每段内选取一个中心作为初始中心点,进行迭代运算;为寻找最优的聚类数目k,定义了新的聚类有效性函数—聚类指数,包含聚类紧密度和聚类显著度两个指标,通过最优化聚类指数,在[1,n(1/2)]内寻找最优的k值。在IRIS数据集进行的仿真实验结果表明,算法的迭代次数明显减少,寻找的最优k值接近数据集的真实情况,算法有效性得到了验证。
- 尹成祥张宏军张睿綦秀利王彬
- 关键词:K-MEANS算法
- 基于加权距离的局部离群点检测算法被引量:4
- 2014年
- 针对不同属性对数据点之间距离贡献的不同,提出了一种用于距离度量的属性加权策略。标称属性通过属性取值的信息熵进行加权,数值属性通过属性取值的标准差进行加权,混合属性根据标称属性和数值属性综合加权,加权策略可以放大离群点与正常数据之间的差别。仿真实验区分不同的属性类型对所提加权策略进行了验证,实验结果证明了策略的有效性。
- 尹成祥张宏军张睿綦秀利王彬
- 关键词:属性加权信息熵