您的位置: 专家智库 > >

吴石磊

作品数:8 被引量:8H指数:2
供职机构:中国科学技术大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇期刊文章
  • 2篇专利
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 1篇电子电信

主题

  • 3篇雷达
  • 3篇并行性
  • 2篇多线程
  • 2篇图形处理器
  • 2篇推测多线程
  • 2篇请求
  • 2篇组网
  • 2篇组网雷达
  • 2篇线程
  • 2篇回退
  • 2篇技术性能
  • 2篇降水
  • 2篇降水系统
  • 2篇并行化
  • 2篇并行性分析
  • 2篇处理器
  • 1篇多核
  • 1篇性能评测
  • 1篇异构
  • 1篇异构多核

机构

  • 8篇中国科学技术...
  • 2篇中国人民解放...
  • 1篇中国科学院

作者

  • 8篇吴石磊
  • 7篇安虹
  • 5篇李小强
  • 3篇刘谷
  • 2篇邓博斌
  • 2篇代文博
  • 2篇周伟
  • 2篇李颀
  • 2篇李功明
  • 1篇魏学超

传媒

  • 2篇小型微型计算...
  • 2篇计算机科学

年份

  • 1篇2015
  • 2篇2014
  • 1篇2013
  • 3篇2012
  • 1篇2011
8 条 记 录,以下是 1-8
排序方式:
OpenHMPP+到CUDA源到源翻译系统的设计与实现
通用计算图形处理器(GPGPU,General Purpose Computation on GPU)具有较强的计算能力和较大的存储带宽,使得它在高性能计算方面有着CPU无法替代的优势。随着CUDA、OpenCL等异构并...
吴石磊
关键词:翻译系统性能评测
文献传递
组网雷达估测降水系统并行化方案的设计与实现被引量:5
2012年
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
吴石磊安虹李小强周伟刘谷魏学超
关键词:并行性分析OPENMP
一种输入感知的雷达回波快速聚类实现
2012年
聚类算法作为数据挖掘中的经典算法,在雷达回波的数据分析中经常被采用。然而对于规模和维度都较大的输入数据集,算法十分耗时。很多研究虽然对聚类算法进行了GPU平台的并行和优化的工作,但都忽略了输入数据集对优化的影响。因此,提出了在GPU/CUDA平台上的一种新颖的雷达快速聚类实现。该实现通过运行时的方式对输入的回波数据进行观察,以获取数据的分布信息,用以指导聚类计算在GPU上执行时的线程块调度。而该运行时模块本身的开销非常小。实验表明,引入这种输入感知的运行时调度支持后,大大削减了GPU的计算负载,获得了相对于一般策略的CUDA实现的20%~40%的性能提升,加强了算法的实时性能。
周伟安虹刘谷李小强吴石磊
关键词:聚类算法图形处理器统一计算设备架构
改进推测多线程的方法及装置
本发明公开了一种改进推测多线程技术性能的方法及装置,其方法为:获取网络消息中的推测线程消息,区分并排列由先驱线程和后继线程发出的访存请求消息的优先级顺序,先驱线程发出的访存请求消息的优先级高于后继线程发出的访存请求消息;...
安虹李颀代文博李功明邓博斌吴石磊
文献传递
图广度优先搜索算法面向图形处理器的优化方法研究被引量:2
2014年
近年来,图形处理器(GPU)以其丰富的计算资源和低廉的成本逐渐在高性能计算领域取得一席之地,对于具有规则访存特性的并行程序具有明显的加速作用.但是以图广度优先搜索(BFS)算法为代表的某些不规则应用,在图形处理器上性能表现平平.为了解决不规则程序在图形处理器上的性能瓶颈问题必须分析其行为特征,面向特定体系结构提出有针对性的程序优化方法.本文通过分析图广度优先搜索算法的在GPU上的并行性模式,访存特性以及工作负载,提出了基于并行性剖析与反馈的计算资源重配置方法,动态队列的层次优化方法,以及线程级负载平衡方法.实验表明以上优化方法能够显著提高图广度优先搜索算法为代表的不规则程序在GPU上的性能.
刘谷安虹李小强吴石磊
关键词:图形处理器
组网雷达估测降水系统并行化方案的设计与实现
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量。同时,对实时性要求较高。如果可以缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序...
吴石磊安虹李小强
关键词:并行性分析降水系统
一个面向存储优化GPGPU编译器被引量:1
2014年
近年来,图形处理器(GPU)在通用计算领域的应用越来越广泛,较高的性能功耗比以及合理的价格使其迅速普及.CUDA则是一种在当今图形处理器上进行通用编程的代表语言.但是由于CUDA过多的暴露了底层硬件的细节,使得程序员必须熟悉GPU的硬件细节才能写出高效运行的程序.而且由于GPU硬件在不断进化,使得为某一代GPU开发的程序很难高效的在新的硬件平台上执行.这大大增加了使用CUDA进行编程的难度和工作量.因此本文提出了一个面向存储优化的GPGPU编译器,将高层的制导语言翻译成优化的CUDA语言.硬件无关的高层制导语言提供了简单的编程模型和可移植性.应用了多种存储优化技术的优化编译器则负责生成高性能的CUDA程序.使用Rodinia测试程序集在Tesla C2050 GPU上的实验结果表明,本文的方案达到了较好的性能和可移植性的平衡.
李小强安虹吴石磊
关键词:GPU
改进推测多线程的方法及装置
本发明公开了一种改进推测多线程技术性能的方法及装置,其方法为:获取网络消息中的推测线程消息,区分并排列由先驱线程和后继线程发出的访存请求消息的优先级顺序,先驱线程发出的访存请求消息的优先级高于后继线程发出的访存请求消息;...
安虹李颀代文博李功明邓博斌吴石磊
文献传递
共1页<1>
聚类工具0