中国科学院知识创新工程(INF05-SCE)
- 作品数:4 被引量:48H指数:3
- 相关作者:迟学斌赵永华陈江赵涛程强更多>>
- 相关机构:中国科学院中国科学院研究生院更多>>
- 发文基金:中国科学院知识创新工程国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于SMP集群的MPI+OpenMP混合编程模型及有效实现被引量:41
- 2005年
- SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方法。建立了对称三对角特征问题的多粒度混合并行算法,并在深腾6800超级计算机上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
- 赵永华迟学斌
- 关键词:SMP集群混合编程模型
- 对称矩阵三对角化的有效并行块算法设计被引量:4
- 2006年
- 在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中.本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法.分析块算法大小同矩阵规模和处理器数量的关系.在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能.
- 赵永华迟学斌程强陈江赵涛
- 关键词:对称矩阵三对角矩阵特征值加速比
- SMP集群系统上可扩展并行特征问题求解器研究被引量:1
- 2006年
- 基于对称三对角特征问题的分而治之方法,提出了一个适合SMP集群环境的多级混合并行算法。SMP节点内的并行求解采用了粗粒度和细粒度两种OpenMP并行。为了改善纯MPI算法中的负载不平衡,混合并行算法使用了动态任务分配方法。在深腾6800上的试验表明,混合并行算法具有好的扩展性和加速比。
- 赵永华迟学斌姜金荣
- 关键词:SMP集群MPI+OPENMP
- 对称矩阵三对角化的混合并行算法设计被引量:5
- 2005年
- 基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。
- 赵永华迟学斌陈江
- 关键词:对称矩阵三对角矩阵加速比MPI+OPENMP