吴庆海
- 作品数:3 被引量:3H指数:1
- 供职机构:北京科技大学经济管理学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术经济管理自然科学总论更多>>
- 基于稀疏指数排序的高维数据并行聚类算法被引量:1
- 2011年
- 高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.
- 武森冯小东吴庆海
- 关键词:数据划分高维数据聚类并行计算
- C4S2-473:基于稀疏指数排序的高维数据并行聚类算法
- 数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P_CABOSF...
- 武森冯小东吴庆海
- 关键词:数据划分高维数据聚类并行计算
- Web使用挖掘在网站优化中的应用研究被引量:2
- 2009年
- 针对互联网用户访问Web服务器产生的日志,结合Web使用挖掘相关理论,采用Apriori算法挖掘用户的频繁访问模式。首先进行数据预处理以保证数据的质量及提高挖掘的效率;然后对预处理后的数据采用Apriori算法进行关联规则挖掘,找出其中的频繁访问模式;最后分析结果,总结规则,提出建议。
- 武森吴庆海
- 关键词:WEB使用挖掘数据预处理APRIORI算法网站优化