您的位置: 专家智库 > >

国家自然科学基金(60903041)

作品数:3 被引量:10H指数:2
相关作者:伍楠张春元文梅杨乾明荀长庆更多>>
相关机构:国防科学技术大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 4篇自动化与计算...

主题

  • 2篇处理器
  • 2篇高性能
  • 1篇多处理器
  • 1篇多处理器平台
  • 1篇异构
  • 1篇异构多处理器
  • 1篇硬件
  • 1篇软硬件
  • 1篇软硬件协同
  • 1篇嵌入式
  • 1篇嵌入式处理器
  • 1篇嵌入式计算
  • 1篇流处理器
  • 1篇进程间通信
  • 1篇可配置
  • 1篇可重构
  • 1篇可重构计算
  • 1篇可重构计算机
  • 1篇计算机
  • 1篇共享存储

机构

  • 3篇国防科学技术...

作者

  • 3篇杨乾明
  • 3篇张春元
  • 3篇伍楠
  • 2篇全巍
  • 2篇文梅
  • 1篇荀长庆
  • 1篇管茂林
  • 1篇黄达飞

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇Journa...

年份

  • 2篇2013
  • 2篇2011
3 条 记 录,以下是 1-4
排序方式:
共享存储可重构计算机软硬件通信的优化实现被引量:6
2013年
可重构硬件操作系统BORPH提供的硬件进程概念和以硬件为中心的执行模型可极大地提高可重构计算平台的易用性.BORPH-N为BORPH的扩展系统,主要的扩展是支持在共享存储可重构计算平台上的运行.BORPH-N为硬件进程提供基于共享存储、符合Unix语义的高性能进程间通信支持:共享存储和信号量.利用这两项服务,硬件进程可与系统中其他所有软件进程和硬件进程进行交互.可重构计算的重要目标是利用可重构逻辑对应用的耗时部分进行加速,所以软硬件交互机制的效率至关重要.通过类似远程调用这种简单方式来提供这两项服务,软硬件交互频繁,开销较大,性能难以满足需求.BORPH-N使用的优化策略基于独立执行的基本思路进行设计.实验结果表明,BORPH-N所需硬件开销较小,为硬件进程提供的共享存储和信号量的效率逼近硬件平台的峰值,可以满足实际应用的需求.
荀长庆杨乾明伍楠文梅张春元
关键词:可重构计算软硬件协同共享存储进程间通信
Efficient fine-grained shared buffer management for multiple OpenCL devices
2013年
OpenCL programming provides full code portability between different hardware platforms,and can serve as a good programming candidate for heterogeneous systems,which typically consist of a host processor and several accelerators.However,to make full use of the computing capacity of such a system,programmers are requested to manage diverse OpenCL-enabled devices explicitly,including distributing the workload between different devices and managing data transfer between multiple devices.All these tedious jobs pose a huge challenge for programmers.In this paper,a distributed shared OpenCL memory(DSOM) is presented,which relieves users of having to manage data transfer explicitly,by supporting shared buffers across devices.DSOM allocates shared buffers in the system memory and treats the on-device memory as a software managed virtual cache buffer.To support fine-grained shared buffer management,we designed a kernel parser in DSOM for buffer access range analysis.A basic modified,shared,invalid cache coherency is implemented for DSOM to maintain coherency for cache buffers.In addition,we propose a novel strategy to minimize communication cost between devices by launching each necessary data transfer as early as possible.This strategy enables overlap of data transfer with kernel execution.Our experimental results show that the applicability of our method for buffer access range analysis is good,and the efficiency of DSOM is high.
Chang-qing XUNDong CHENQiang LANChun-yuan ZHANG
关键词:OPENCL
ET:一种能耗有效的高性能嵌入式处理器
随着标准和算法的不断演进,高端嵌入式应用对性能和能耗提出了越来越高的要求。然而,能耗问题成为将VLSI潜力转换为实际应用需求的最大挑战,基于此,本文提出ET(Embedded Tera-scale Computing)处...
杨乾明伍楠管茂林张春元全巍黄达飞
关键词:嵌入式计算
文献传递
高性能异构多处理器平台及其应用被引量:4
2011年
在视频编解码领域,随着视频图像分辨率的提高,对处理平台的计算能力、存储、传输带宽的需求急剧增加。为满足高分辨率视频编解码对处理平台的巨大性能需求,本文结合流处理器在媒体处理上的独特优势以及FPGA灵活的可配置性,构建了一个由流处理器和FPGA组成的可配置异构多处理器平台。为了对平台进行性能测试,将MOTIONJPEG算法并行化后映射到该平台上,对分辨率为4096×2160的高清数字电影源文件进行视频编码,达到了30.3帧/s的压缩速率。
全巍文梅伍楠杨乾明张春元
关键词:异构多处理器可配置流处理器
共1页<1>
聚类工具0