您的位置: 专家智库 > >

吴志川

作品数:3 被引量:15H指数:2
供职机构:北京大学信息科学技术学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇数据划分
  • 2篇MAPRED...
  • 2篇MAPRED...
  • 1篇优化设计
  • 1篇可伸缩
  • 1篇分布式
  • 1篇分布式计算
  • 1篇负载平衡
  • 1篇HADOOP
  • 1篇大数据

机构

  • 3篇北京大学

作者

  • 3篇陈立军
  • 3篇韩蕾
  • 3篇吴志川
  • 1篇毛琛

传媒

  • 1篇计算机研究与...
  • 1篇计算机科学与...
  • 1篇中国计算机学...

年份

  • 3篇2013
3 条 记 录,以下是 1-3
排序方式:
MapReduce上基于抽样的数据划分最优化研究被引量:12
2013年
MapReduce是一个目前应用广泛的并行计算框架,如何解决Reduce节点的负载平衡问题是MapReduce程序执行效率的一个重要研究方向.基于抽样的划分是一种比较有效的数据划分方法,为了使得抽样方法发挥最大程度的效益,研究了抽样效果与其重要影响因素之间的定量关系,并给出了相关理论及其证明推导,同时通过实验进一步验证了理论的正确性.基于研究的结果,可以在给定MapReduce环境中,通过分析数据特征,找到最优抽样样本规模,从而通过尽可能小的抽样代价来得到满足要求的数据划分.通过将研究成果应用在改进的Terasort算法上,以实例验证了其在MapRedece平台上的实际意义.
韩蕾孙徐湛吴志川陈立军
关键词:MAPREDUCE框架负载平衡
高度可伸缩的稀疏矩阵乘法被引量:3
2013年
矩阵乘法是线性代数和图算法中非常重要的一个基本操作,而大规模数据处理中的矩阵往往是稀疏矩阵。MapReduce编程框架能够有效地支持海量数据的分布式计算。因此,对如何运用MapReduce编程框架实现超大规模稀疏矩阵的乘法进行了研究。传统矩阵乘法并行算法没有针对稀疏矩阵进行专门优化,导致计算过程中出现大量不必要的通信开销。提出了一种新的算法——CRM(column row multiplication)算法,并与传统的矩阵分块算法进行了比较。实验证明,CRM算法运行效率有很大的提高,并且具有高度的可伸缩性,适合在MapReduce平台上运行。
吴志川毛琛韩蕾陈立军
关键词:分布式计算HADOOP
MapReduce上基于抽样的数据划分最优化研究
MapReduce是一个目前应用广泛的并行计算框架,如何解决Reduce节点的负载平衡问题是MapReduce程序执行效率的一个重要研究方向.基于抽样的划分是一种比较有效的数据划分方法,为了使得抽样方法发挥最大程度的效益...
韩蕾孙徐湛吴志川陈立军
关键词:MAPREDUCE框架数据划分优化设计
文献传递
共1页<1>
聚类工具0