您的位置: 专家智库 > >

吴再龙

作品数:4 被引量:8H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 3篇跨平台
  • 3篇OPENCL
  • 2篇迭代
  • 2篇迭代算法
  • 2篇并行计算
  • 1篇软件开发
  • 1篇体系架构
  • 1篇图像
  • 1篇架构
  • 1篇OPENCV

机构

  • 4篇中国海洋大学
  • 2篇中国科学院
  • 2篇中国科学院软...

作者

  • 4篇吴再龙
  • 2篇徐建良
  • 2篇张云泉
  • 2篇贾海鹏
  • 1篇颜深根
  • 1篇解庆春
  • 1篇龙国平

传媒

  • 1篇计算机科学与...
  • 1篇科研信息化技...
  • 1篇2013全国...

年份

  • 2篇2014
  • 2篇2013
4 条 记 录,以下是 1-4
排序方式:
基于OpenCL的图像重映射算法优化研究被引量:3
2013年
图像重映射(Remap)算法是典型的图像变化算法。在图像放缩、扭曲、旋转等领域有着广泛的应用。随着图片规模和分辨率的不断提高,对图形映射算法的性能提出了越来越高的要求。本文在充分考虑不同GPU平台硬件体系结构差异的基础上,系统研究了在OpenCL框架下图像映射(Remap)算法在不NGPU平台上的高效实现方式。并从片外内存访存优化,向量化计算,减少动态指令等多个优化角度考察了不同优化方法在不同GPU平台上对性能的影响,提出了在不同GPU平台间实现性能移植的可能性。实验结果表明,优化后的算法在不考虑数据传输时间的前提下,在AMDHD5850GPU上相对于CPU版本取得114.3--491.5倍的加速比,相对于CUDA版本(现有GPU算法的实现)得到1.01~1.86的加速比,在NIVIDIAC2050GPU上相对CPU版苓取得100.7~369.8倍的加速比,相对于CUDA版本得到0.95~1.58的加速比。有效验证了本文提出的优化方法的有效性和胜能可移植性。
吴再龙张云泉龙国平徐建良贾海鹏
关键词:OPENCL跨平台
基于OpenCL的Kmeans算法的优化研究
Kmeans算法是典型的聚类算法,是已知数据划分和分组处理的重要方法。在图像处理、机器学习、生物学有着广泛的应用。随着数据规模的不断变大,对Kmeans算法的性能提出了越来越高的要求。本文在充分考虑不同硬件平台硬件体系结...
吴再龙张云泉徐建良贾海鹏颜深根王伟俨
关键词:并行计算迭代算法跨平台
众核体系下算法优化的若干技术研究
众核体系架构主要包括GPU,异构CPU上的GPU单元和使用x86指令集的MIC加速部件等,一般应用于通用计算的计算单元。近年来,由于 CPU发展遇到了频率墙、功耗墙和存储墙等一系列瓶颈,使用众核体系架构获得更高的计算性能...
吴再龙
关键词:软件开发
文献传递
基于OpenCL的Kmeans算法的优化研究被引量:4
2014年
Kmeans算法是无监督机器学习中一种典型的聚类算法,是对已知数据集进行划分和分组的重要方法,在图像处理、数据挖掘、生物学领域有着广泛的应用。随着实际应用中数据规模的不断变大,对Kmeans算法的性能也提出了更高的要求。在充分考虑不同硬件平台体系架构差异的基础上,系统地研究了Kmeans算法在GPU和APU平台上实现与优化的关键技术:片上全局同步高效实现,冗余计算减少全局同步次数,线程任务重映射,局部内存重用等,实现了Kmeans算法在不同硬件平台上的高性能与性能移植。实验结果表明,优化后的算法在考虑数据传输时间的前提下,在AMD HD7970 GPU上相对于CPU版本取得136.975~170.333倍的加速比,在AMD A10-5800K APU上相对于CPU版本取得22.2365~24.3865倍的加速比,有效验证了优化方法的有效性和平台的可移植性。
吴再龙张云泉徐建良贾海鹏颜深根解庆春
关键词:并行计算迭代算法跨平台
共1页<1>
聚类工具0