您的位置: 专家智库 > >

国家自然科学基金(2009ZX05038-001)

作品数:1 被引量:65H指数:1
相关作者:毛典辉更多>>
相关机构:北京工商大学更多>>
发文基金:国家自然科学基金北京市属高等学校科学技术与研究生教育创新工程建设项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇聚类
  • 1篇分布式
  • 1篇分布式聚类
  • 1篇MAPRED...
  • 1篇CANOPY

机构

  • 1篇北京工商大学

作者

  • 1篇毛典辉

传媒

  • 1篇计算机工程与...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于MapReduce的Canopy-Kmeans改进算法被引量:65
2012年
针对分布式Canopy-Kmeans算法中Canopy选取的随机性问题,采用"最小最大原则"对该算法进行了改进,避免了Cannopy选取的盲目性;采用MapReduce并行计算框架对算法进行了并行扩展,使之能够充分利用集群的计算和存储能力,从而适应海量数据的应用场景。以海量互联网新闻信息聚类作为应用背景,对改进后的算法进行了实验分析。实验结果表明:该方法较随机挑选Canopy策略在分类准确率以及抗噪能力上都明显提高,而且在处理海量数据时表现出较大的性能优势。
毛典辉
关键词:MAPREDUCE分布式聚类
共1页<1>
聚类工具0