北京邮电大学网络与交换技术国家重点实验室开放课题基金(2005-05)
- 作品数:4 被引量:11H指数:1
- 相关作者:张云泉王向前蒋孟奇宋刚李玉成更多>>
- 相关机构:中国科学院软件研究所中国科学院研究生院中国科学院大学更多>>
- 发文基金:北京邮电大学网络与交换技术国家重点实验室开放课题基金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- HPCC在IBM刀片机群上的诊断测试与结果分析
- 2009年
- 在IBMJS21 Blade Center上进行2次HPCC测试,介绍HPCC的结果分析方法,并采用分层模型AHPCC对HPCC的测试结果进行分析。其目的是通过在高性能机群上执行HPCC测试说明HPCC测试对机群系统的评价和诊断能力。实验发现,在之前的HPL测试结果一直不理想并且无法更进一步发现和解决问题的情况下,采用HPCC测试能够较好地评价系统和诊断系统问题。通过分层模型的评价,能够得到更多关于目标系统的性能参数和发现可能的性能瓶颈,为系统设计及构建积累有价值的经验。
- 王宣强王向前张云泉
- 并行计算模型参数动态分析软件包设计
- 2009年
- 并行计算模型的发展引入越来越多的模型参数。对并行计算模型参数动态采集分析软件包DEMPAT的整体框架进行研究,实现基于硬件性能计数器的存储层次参数采集模块。实验表明,该模块能够准确快速地获取存储层次参数且具有较好的可移植性。
- 王向前张云泉侯晓吻
- 关键词:并行计算模型
- 有限元单元计算子程序的OpenMP并行化被引量:11
- 2008年
- Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。
- 宋刚蒋孟奇张云泉李玉成
- 关键词:并行编程多线程多核有限元
- RAM(h)模型下SpMV存储访问复杂度的分析
- 2009年
- 稀疏矩阵向量乘(SpMV)采取压缩行存储格式的算法性能非常差,而寄存器分块算法可以使得数据尽量在靠近处理器的存储层次中访问而提高性能。利用RAM(h)模型进行分析和比较不同算法形式的存储访问复杂度,可以比较两种算法的优劣。通过RAM(h)分析SpMV两种实现形式的存储访问复杂度,同时在奔腾四平台上,测试了7个稀疏矩阵的SpMV性能,并统计了这两种算法中L1,L2,和TLB的缺失率,实验结果与模型分析的数据一致。
- 袁娥张云泉孙相征
- 关键词:稀疏矩阵向量乘