您的位置: 专家智库 > >

教育部科学技术研究重点项目(108008)

作品数:7 被引量:30H指数:3
相关作者:李建江张磊路川胡长军狄鹏更多>>
相关机构:北京科技大学中国石油化工股份有限公司勘探南方分公司中国石油天然气集团公司更多>>
发文基金:教育部科学技术研究重点项目国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 7篇自动化与计算...

主题

  • 4篇GPU
  • 3篇图像
  • 3篇CUDA
  • 2篇图像处理
  • 2篇图像处理单元
  • 2篇OPENMP
  • 1篇代码
  • 1篇代码生成
  • 1篇迭代
  • 1篇迭代算法
  • 1篇多核
  • 1篇多核平台
  • 1篇性能分析
  • 1篇映射
  • 1篇语义查询
  • 1篇语义映射
  • 1篇直方图
  • 1篇数据分解
  • 1篇数据通信
  • 1篇通信

机构

  • 7篇北京科技大学
  • 1篇中国石油大学...
  • 1篇中国石油天然...
  • 1篇中国石油化工...
  • 1篇中国石油

作者

  • 6篇李建江
  • 2篇张磊
  • 2篇狄鹏
  • 2篇胡长军
  • 2篇路川
  • 1篇徐九韵
  • 1篇欧阳纯萍
  • 1篇樊少明
  • 1篇李华昱
  • 1篇王珏
  • 1篇李兴钢
  • 1篇刘珍珍
  • 1篇陈翔
  • 1篇黄义双

传媒

  • 2篇计算机研究与...
  • 2篇电子科技大学...
  • 1篇计算机应用
  • 1篇小型微型计算...
  • 1篇计算机科学

年份

  • 4篇2012
  • 1篇2011
  • 2篇2010
7 条 记 录,以下是 1-7
排序方式:
CUDA架构下的灰度图像匹配并行算法被引量:15
2012年
提出一种NVIDIACUDA架构下的灰度图像匹配算法,利用GPU加速灰度图像的匹配过程。实际的测试结果表明,在现有实验环境中,对同一图像,在不损失匹配精度的前提下,在GPU上使用CUDA实现的灰度图像匹配并行算法比在CPU上使用MPI实现的灰度图像匹配并行算法快了40多倍,性能得到了显著提高,从而使灰度图像匹配应用于如交互式系统等实时应用成为可能。
李建江张磊李兴钢陈翔黄义双
关键词:CUDAGPU灰度图像匹配
一种高效直方图生成算法在GPU上的实现被引量:2
2012年
直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理器平台,特别是当前最先进的图像处理单元(Graphic Processing Unit,GPU)实现高效的直方图生成算法是很有研究价值的。为了减少直方图生成过程中的存储体冲突,通过内存填充技术,将多线程的共享内存访问均匀地分散到各个存储体,可以大幅减少直方图生成算法在GPU上的内存访问延时。同时,通过提出有效可靠的近似最优配置搜索模型,可以指导用户配置GPU执行参数,以获得更高的性能。经实验验证,在实际应用中,改良后的算法比原有算法性能提高了42%~88%。
狄鹏胡长军李建江
关键词:图像处理单元
GPU上高效Jacobi迭代算法的研究与实现被引量:2
2012年
Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数据相关,增强数据局部性,从而获得更高的执行性能.此外,利用块(Tile)大小选取模型,合理的划分计算数据,充分利用GPU的运算资源,进一步提高性能.实验结果表明,Jacobi奇偶复制算法比传统Jacobi并行算法在GPU上的性能提高4倍以上.
狄鹏胡长军李建江
关键词:图像处理单元
基于指导语句的CUDA程序性能分析工具研究与实现被引量:1
2012年
近年来,GPU的快速发展与NVIDIA公司推出的CUDA技术,推动着GPU在高性能计算领域中的应用。研究并实现CUDA程序性能分析工具,对充分利用GPU的计算优势和提高CUDA架构下并行程序的执行性能具有重要的意义。该文分析了GPU硬件平台的特点和CUDA并行编程模型,结合CPU集群环境下并行程序的性能分析,设计并实现了一种基于指导语句的CUDA程序性能分析工具,并实验验证了其在不同GPU硬件平台上的有效性。
李建江路川张磊
关键词:CUDA性能分析
基于领域本体和关系模型的XML语义集成方法被引量:3
2011年
由于缺乏足够的语义信息,不同模式的XML数据之间很难进行互操作。针对油气井工程中的XML数据集成需求,借助领域全局本体,提出一种模式无关的XML语义集成方法。该方法首先在XML Path路径与领域本体之间进行语义映射,屏蔽其模式差异;然后,按照模型映射方法将XML存储为关系数据;最后通过查询重写将SPARQL转换为SQL语句,实现语义查询。该方法对XML模式进行语义标注,利用关系数据库存储与查询XML数据,能有效处理领域XML数据的语义集成。
李华昱欧阳纯萍徐九韵
关键词:领域本体XML模式语义映射语义查询
一种单GPU程序向多GPU移植的模板化技术被引量:5
2010年
图形处理器(GPU)作为一种高度并行化的处理器架构,已得到越来越多的重视,目前已诞生了以NVIDIA CUDA为代表的各种GPU通用计算技术,同时多GPU并行计算也已有了实际的应用.多GPU并行计算涉及GPU与CPU两者之间的协调和交互,对程序员有着更高的要求.为此,提出一种基于模板的源代码生成技术,通过模板转化来支持单GPU程序的并行化移植.最后通过一个实例表明使用提出的CUDA源代码移植框架能够自动生成与手写程序等价的代码,可以显著降低多GPU下CUDA程序的开发代价,提高CUDA应用程序员的生产效率.
李建江李兴钢路川樊少明
关键词:代码生成CUDAOPENMP数据分解数据通信
基于IBM Cell多核平台的OpenMP数组私有化技术研究被引量:2
2010年
数组私有化是并行化编译中的重要技术之一,IBMCell是异构多核处理器,SPMD代表实现OpenMP数组私有化的重要手段,但是SPMD形式的OpenMP程序却不能直接通过IBMXLC(适用于IBMCell多核平台的编译器)的编译.为了解决该问题,并充分利用IBMCell本地存储器中的静态缓冲区以减少DMA通信,提出一种IBMCell多核平台的OpenMP数组私有化技术.旨在充分利用本地存储器、减少DMA通信,集中处理可重用数据的私有化.主要包括:数组私有化分析、数组私有化转换、同步消除与非阻塞DMA操作,从而扩大数据的可重用作用域.转换后的Jacobi迭代代码进行实际测试表明,这种基于IBMCell多核平台的数组私有化技术能够平均提高3%左右的执行性能,尤其对于小规模计算来说性能提高还会更多.
李建江刘珍珍王珏
关键词:OPENMPDRG非阻塞
共1页<1>
聚类工具0