李健
- 作品数:2 被引量:55H指数:2
- 供职机构:西北政法大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 聚类分析中类数估计方法的实验比较被引量:26
- 2008年
- 在基因表达数据的探索性聚类分析中,聚类个数的确定是决定聚类质量的关键因素。许多聚类有效性评价指标和方法可用于PAM聚类算法。该文讨论适合于PAM算法的7种常用评价指标和方法,采用4种不同聚类结构特征的基因表达数据对它们的性能进行实验比较。结果表明,系统演化方法和稳定性方法估计聚类个数的性能最好,正确率分别为100%与90%。
- 王开军李健张军英过立新
- 关键词:聚类有效性聚类分析基因表达数据
- 半监督的仿射传播聚类被引量:31
- 2007年
- 仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。
- 王开军李健张军英涂重阳
- 关键词:仿射传播聚类半监督聚类