刘冬冬
- 作品数:5 被引量:2H指数:1
- 供职机构:西安交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种针对多核平台的二进制程序自动并行化的设计方法
- 本发明公开了一种针对多核平台的二进制程序自动并行化的设计方法,将多核平台中的二进制翻译成LLVM?IR,然后先通过分析LLVM?IR,建立控制流图来找出程序中的所有循环。静态分析循环的并行性,剔除不易并行的循环。在为循环...
- 梅魁志李博良南宝松刘冬冬黄雄刘辉高榕
- 文献传递
- 一种针对多核平台的二进制程序自动并行化的设计方法
- 本发明公开了一种针对多核平台的二进制程序自动并行化的设计方法,将多核平台中的二进制翻译成LLVM IR,然后先通过分析LLVM IR,建立控制流图来找出程序中的所有循环。静态分析循环的并行性,剔除不易并行的循环。在为循环...
- 梅魁志李博良南宝松刘冬冬黄雄刘辉高榕
- 文献传递
- 面向OpenCL的Mali GPU仿真器构建研究被引量:2
- 2015年
- 针对嵌入式GPU通用计算的仿真器构建需求,通过对通用图形处理单元仿真器(general purpose graphics processing unit-simulator,GPGPU-sim)的计算核心、存储结构与Mali GPU的异同进行比较分析,首先建立面向OpenCL的Mali GPU仿真器的流程与结构,并设计计算单元数、寄存器数、最小并行粒度等GPU微体系结构参数的获取方法,在对GPGPU-sim进行修改和配置后,实现了对特定GPU架构的仿真器构建。使用矩阵相乘、图像处理等OpenCL程序对仿真器的准确性进行测试,以程序在仿真器和硬件平台上的执行周期数差距作为评估依据。实验结果表明:对于测试程序集中优化前的OpenCL程序,其中70%的程序在两个平台上的运行周期数差距不超过30%;对于优化后的OpenCL程序,其中90%的程序的运行周期数差距不超过30%。由此证明,构建的GPU仿真器能够满足OpenCL程序的仿真与性能评估。
- 崔继岳梅魁志刘冬冬李博良
- 关键词:图形处理器OPENCL仿真器
- 一种基于视觉的缺陷竹块检测分拣装置及方法
- 一种基于视觉的缺陷竹块检测分拣装置及方法,装置包括工件槽,工件槽通过第一传送带和第二传送带配合,在第二传送带上设有挡板与第一门型可调支架,第一门型可调支架上连接有第一矩形无影光源及第一相机,第二传送带末端设有第一delt...
- 王恪典刘冬冬贾国华梅雪松
- 文献传递
- 一种基于视觉的缺陷竹块检测分拣装置及方法
- 一种基于视觉的缺陷竹块检测分拣装置及方法,装置包括工件槽,工件槽通过第一传送带和第二传送带配合,在第二传送带上设有挡板与第一门型可调支架,第一门型可调支架上连接有第一矩形无影光源及第一相机,第二传送带末端设有第一delt...
- 王恪典刘冬冬贾国华梅雪松
- 文献传递