您的位置: 专家智库 > >

张丹丹

作品数:14 被引量:29H指数:3
供职机构:上海超级计算中心更多>>
发文基金:国家高技术研究发展计划国家自然科学基金博士研究生创新基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 7篇期刊文章
  • 6篇会议论文
  • 1篇科技成果

领域

  • 13篇自动化与计算...
  • 1篇理学

主题

  • 6篇性能分析
  • 5篇格子BOLT...
  • 4篇并行计算
  • 3篇内存
  • 3篇内存优化
  • 3篇编程
  • 3篇CACHE优...
  • 2篇多核
  • 2篇多线程
  • 2篇性能比较
  • 2篇异构
  • 2篇异构平台
  • 2篇运行性
  • 2篇运行性能
  • 2篇线程
  • 2篇魔方
  • 2篇编程模型
  • 2篇NPB
  • 2篇FDTD
  • 2篇GPU集群

机构

  • 14篇上海超级计算...
  • 3篇复旦大学
  • 3篇上海大学
  • 1篇上海市应用数...

作者

  • 14篇张丹丹
  • 10篇徐磊
  • 10篇徐莹
  • 3篇赵鹏
  • 2篇钱跃竑
  • 2篇李根国
  • 1篇吴建成
  • 1篇汪鲁兵
  • 1篇刘波
  • 1篇张挺
  • 1篇陈家慧
  • 1篇王涛
  • 1篇徐彬
  • 1篇时伟
  • 1篇魏玉琪
  • 1篇寇大治
  • 1篇田振夫
  • 1篇刘杰
  • 1篇刘晶
  • 1篇姜恺

传媒

  • 3篇计算机工程与...
  • 2篇计算机应用与...
  • 1篇微电子学与计...
  • 1篇计算机科学
  • 1篇2008年全...
  • 1篇2009年全...
  • 1篇2009年全...
  • 1篇2013全国...
  • 1篇2008年全...

年份

  • 2篇2013
  • 2篇2012
  • 2篇2011
  • 5篇2009
  • 3篇2008
14 条 记 录,以下是 1-10
排序方式:
GPU集群上的三维UPML-FDTD算法的实现及优化
高性能计算领域,拥有强大浮点计算性能的协处理器正在快速的发展。近年来,利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题。本文在GPU集群上买现了三维UPML—FDTD算法并进行了...
徐磊徐莹蒋荣琳张丹丹
关键词:FDTDGPU集群MPI
SSearch基于众核加速的并行模型分析
2012年
介绍SSearch核心算法的特点,分析该算法的并行性,并以GPU以及类Cell处理器为例分析算法对众核系统的适用性。在此基础上提出众核系统下的SSearch并行模型。
张丹丹徐莹徐磊李根国
超算中心Xfinity高性能计算平台软件v1.0
李根国姜恺吴建成刘杰徐彬魏玉琪邓雪滨张挺刘波刘晶张伟刘祎洋徐磊张丹丹陈家慧徐莹薛刚戴坚君邹伟新王涛寇大治时伟
该软件面向高性能计算用户,整合上海超级计算中心及用户内部资源,为用户提供方便、快捷的使用资源的方式,包括文件管理、作业提交、作业管理、动态信息查询、统计信息查询、交流空间、命令行以及用户管理、项目管理等功能;保证用户使用...
关键词:
格子Boltzmann算法并行性能的系统分析被引量:1
2009年
从处理器映射方式、域分解方式、通信开销、通信模式、可扩展性等方面对格子Boltzmann算法的并行性能作了全面系统的分析,并提出了对该类并行程序效率定量化分析的方法。经过相应的测试与分析,说明该方法对提高大规模并行计算的效率具有指导作用。
张丹丹赵鹏钱跃竑
关键词:并行计算性能分析
异构平台下格子Boltzmann方法实现及性能分析被引量:1
2012年
对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA,MPI+CUDA,MPI+OpenMP+CUDA多级并行算法。结果表明,算法具有较好的加速性能;提出的根据计算量比例参数调节CPU和GPU之间负载均衡的方法,对于在异构平台上实现多级并行处理及资源的有效利用具有一定的参考和应用价值。
张丹丹徐莹徐磊
关键词:异构平台GPU格子BOLTZMANN
基于“魔方”的不同编程模型下科学应用性能比较被引量:2
2009年
本文基于魔方(曙光5000A)"超并行"系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi-Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨节点采用混合编程模型能获得更好性能,测试结果为百万亿次系统的使用及应用性能的提升起到指导作用。
张丹丹徐磊徐莹
关键词:NPB
格子Boltzmann并行程序的优化与性能分析被引量:3
2008年
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提高.
赵鹏张丹丹汪鲁兵田振夫钱跃竑
关键词:格子BOLTZMANNCACHE优化内存优化并行计算
格子Boltzmann并行程序的优化与性能分析
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提...
赵鹏张丹丹汪鲁兵田振夫钱跃竑
关键词:格子BOLTZMANNCACHE优化内存优化并行计算
文献传递
异构平台下格子Boltzmann方法实现及性能分析
论文对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA, MPI+CUDA, MPI+OpenMP+CUDA多级并行算法。 结果表明,算法具有较好的加速性能;提出的根据...
张丹丹徐莹徐磊
关键词:异构平台并行编程模式负载均衡图形处理单元
基于“魔方”的不同编程模型下科学应用性能比较
本文基于魔方(曙光5000A)“超并行”系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨...
张丹丹徐磊徐莹
关键词:系统架构
文献传递
共2页<12>
聚类工具0