您的位置: 专家智库 > >

曹海军

作品数:9 被引量:15H指数:2
供职机构:西安交通大学更多>>
发文基金:中央高校基本科研业务费专项资金国家高技术研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 4篇专利

领域

  • 5篇自动化与计算...

主题

  • 3篇异构
  • 2篇多核
  • 2篇异构多核
  • 2篇预处理
  • 2篇数据块
  • 2篇图形处理器
  • 2篇平衡方法
  • 2篇GPU
  • 2篇HDFS
  • 2篇处理器
  • 1篇迭代
  • 1篇迭代式
  • 1篇多核架构
  • 1篇多机
  • 1篇云计算
  • 1篇云计算环境
  • 1篇运行速率
  • 1篇软件包
  • 1篇数据划分
  • 1篇数据流

机构

  • 9篇西安交通大学
  • 1篇上海海洋大学

作者

  • 9篇曹海军
  • 9篇董小社
  • 4篇张保
  • 3篇张兴军
  • 3篇朱霍
  • 3篇李亮
  • 3篇樊源泉
  • 3篇白秀秀
  • 2篇刘超
  • 2篇魏伟
  • 2篇伍卫国
  • 2篇李丹
  • 1篇马冬冬
  • 1篇赵旭
  • 1篇冯国富
  • 1篇刘超
  • 1篇梅一多
  • 1篇李丹
  • 1篇冯景华
  • 1篇姚超

传媒

  • 2篇西安交通大学...
  • 2篇高技术通讯
  • 1篇计算机学报

年份

  • 1篇2016
  • 1篇2014
  • 1篇2013
  • 3篇2012
  • 3篇2011
9 条 记 录,以下是 1-9
排序方式:
一种面向GPU的数据流处理方法
本发明公开了一种面向GPU的数据流处理方法,首先,在CPU和GPU组成的异构并行系统中运行待处理的数据密集型计算模块,得到拷入时间Ti、计算时间Tc、拷回时间To;然后,根据三部分运行时间计算如下比例关系:a=Tc/Ti...
董小社张保曹海军张兴军冯景华李亮刘超李丹白秀秀刘袁
文献传递
面向异构多核并行系统的层次化计算模型HmPlogP
2011年
在参数化LogP模型(PLogP模型)的基础上,针对异构多核并行系统通用核和加速核的异构性、存储的层次化、并行执行的层次化特征,提出了新的层次化计算模型HmPlogP。该模型对异构多核并行系统的通信和访存进行了抽象,采用向量化参数表达并行系统不同层次的特征,能够预测加速核的执行开销并以此指导并行程序的设计和优化。实验结果表明,HmPlogP模型能有效地预测通用核的点到点通信时间和加速核的访存时间。
李亮董小社曹海军冯国富张兴军
关键词:异构多核
一种HDFS运行时数据块平衡方法
本发明公开了一种HDFS运行时数据块平衡方法,该方法首先对节点本地任务列表进行预处理,为每一个节点划分出完成本地任务和非完全本地任务,以提供启动HDFS数据块平衡判断的依据。接着对各个节点的运行速率就行评估和任务请求预测...
曹海军伍卫国董小社樊源泉魏伟朱霍
文献传递
一种云计算环境下基于工作流的软件部署系统及部署方法
本发明提供一种云计算环境下基于工作流的软件部署系统及部署方法,软件部署系统包括用户接口层、系统逻辑层和云资源层;用户接口层用于用户描述软件部署规划、定义软件之间的依赖关系、查询目标机器节点状态、描述软件属性和监控软件部署...
曹海军董小社张兴军叶斌赵旭樊源泉朱霍马冬冬姚超
文献传递
一种HDFS运行时数据块平衡方法
本发明公开了一种HDFS运行时数据块平衡方法,该方法首先对节点本地任务列表进行预处理,为每一个节点划分出完成本地任务和非完全本地任务,以提供启动HDFS数据块平衡判断的依据。接着对各个节点的运行速率就行评估和任务请求预测...
曹海军伍卫国董小社樊源泉魏伟朱霍
文献传递
面向异构多核架构的自适应编译框架被引量:2
2014年
针对应用在移植到异构多核高性能计算机系统中所面临的可移植性差以及性能优化难度大的问题,文中提出一种面向异构多核架构的自适应编译框架.通过源到源编译解决传统并行编程模型应用向异构多核架构的映射问题;同时利用动态剖分信息,自适应地调整插桩并配置优化策略,形成迭代式的自动优化过程.文中自适应编译框架将软硬件映射机制与优化策略结合,有效地解决了同构并行应用向异构多核架构的移植问题并提高了应用的整体性能.实验结果表明,文中基于Cell架构实现的原型系统,很好地解决了异构多核架构下应用移植性等问题,同时应用性能有所提高.
白秀秀董小社刘超曹海军李亮
关键词:异构多核插桩
面向图形处理器重叠通信与计算的数据划分方法被引量:5
2011年
针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,将应用数据按比例划分为大小不同的数据块后分批提交给GPU处理,使系统的传输资源PCI-E总线和计算资源GPU在一段时间内并行工作,从而实现了应用通信与计算的重叠.在处理按照比例划分的数据块过程中,尽可能充分利用系统的传输资源和计算资源,以减少数据传输和计算的相互等待时间.实验结果表明,采用数据比例划分方法后的应用性能明显提高,可以有效地重叠通信与计算时间,矩阵相乘和快速傅里叶变换总执行时间比未划分时分别减少了5%和30%左右,比平均划分时分别减少了3%和6%左右.
张保曹海军董小社李丹胡雷钧
关键词:图形处理器数据划分
CPU-GPU系统中基于剖分的全局性能优化方法被引量:10
2012年
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右.
张保董小社白秀秀曹海军刘超梅一多
关键词:全局优化
GPU-S2S:面向GPU的源到源翻译转化
2012年
针对图形处理器(GPU)架构下的软件可移植性、可编程性差的问题,为了便于在GPU上开发并行程序,通过自动映射与静态编译相结合,提出了一种新的基于制导语句控制的编译优化方法,实现了一个源到源的自动转化工具GPU-S2S,它能够将插入了制导语句的串行C程序转化为统一计算架构(CUDA)程序。实验结果表明,经GPU-S2S转化生成的代码和英伟达(NVIDIA)提供的基准测试代码具有相当的性能;与原串行程序在CPU上执行相比,转换后的并行程序在GPU上能够获取显著的性能提升。
李丹曹海军董小社张保
共1页<1>
聚类工具0