您的位置: 专家智库 > >

郭振华

作品数:7 被引量:3H指数:1
供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家重点实验室开放基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 2篇映射
  • 2篇自动映射
  • 1篇调度
  • 1篇异构
  • 1篇隐马尔可夫模...
  • 1篇阵列
  • 1篇数据重用
  • 1篇系统结构
  • 1篇现场可编程
  • 1篇现场可编程门...
  • 1篇流水线
  • 1篇流水线调度
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇脉动阵
  • 1篇脉动阵列
  • 1篇门阵列
  • 1篇可编程门阵列
  • 1篇可重构
  • 1篇计算机

机构

  • 7篇哈尔滨工程大...

作者

  • 7篇郭振华
  • 7篇吴艳霞
  • 6篇张国印
  • 2篇陆志坚
  • 1篇牛晓霞
  • 1篇顾国昌
  • 1篇杨杰
  • 1篇李璐
  • 1篇孙延腾

传媒

  • 2篇计算机工程与...
  • 1篇电子学报
  • 1篇计算机学报
  • 1篇吉林大学学报...
  • 1篇2012全国...
  • 1篇2014全国...

年份

  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 2篇2013
  • 1篇2012
7 条 记 录,以下是 1-7
排序方式:
基于LLVM的函数内联优化技术研究
2017年
函数内联(Function Inlining)是使用函数体代替函数调用的一种编译优化技术。LLVM中原生的内联模型只根据函数体的大小来判断函数内联与否,而没有考虑函数的调用次数和后续的优化。针对这个问题,提出了基于函数调用次数(NFC)和考虑后续循环合并(BLF)的新内联模型。首先,通过NFC模型对被多次调用的函数进行内联,进而减少更多因函数调用而产生的额外消耗。其次,通过BLF模型能够识别出进行内联后可以进一步进行循环合并优化的函数,为后续循环合并优化提供支持。实验结果表明,提出的函数内联优化技术是可行的,测试程序平均加速比为1.52%。
郭振华吴艳霞安龙飞张国印卢文祥
关键词:加速比
面向ASCRA的循环流水启动间距自动分析及优化
2015年
在实现循环到流水硬件结构自动映射过程中,迭代间启动间距的自动分析技术是可重构编译器研究的难点.在现有细粒度可重构编译器中,主要采用人工输入制导语句的方法来控制循环并行流水硬件结构自动映射所需启动间距信息的生成,该方法只能采用固定启动间距方式对流水硬件结构进行控制,不能充分发挥并行流水硬件结构的性能,同时人工确定启动间距的方法降低了可重构计算应用的部署效率.针对细粒度可重构编译器的现状,文中提出了一种面向ASCRA的循环流水启动间距自动分析及优化方法.在细粒度可重构编译器中,建立多层循环流水迭代间启动间距分析模型,提出非固定启动间距控制策略,采用自动生成算法得到迭代间启动间距向量信息,并采用流水线调度技术对迭代间启动间距进行优化.实验结果表明,与现有HLS工具相比,文中方法不仅能够提高可重构计算应用在异构加速平台上的部署效率,同时能够有效改善循环应用在FPGA协处理器中流水执行时的性能,具有一定的可行性.
郭振华吴艳霞张国印戴葵
关键词:自动映射
一种改进ASAP调度的流水线自动划分算法
为了解决目前可重构编译器在处理可流水的计算密集型循环程序时不能自动选择合理的流水线划分方式的问题,提出了一种以器件延时为运算调度参数的流水线自动划分算法。该算法在采用ASAP调度的直接流水线划分方法的基础上,以循环程序中...
郭振华吴艳霞张国印陆志坚牛晓霞
关键词:流水线调度
文献传递
面向ASCRA的循环流水启动间距自动分析及优化
在实现循环到流水硬件结构自动映射过程中,迭代间启动间距的自动分析技术是可重构编译器研究的难点。在现有细粒度可重构编译器中,主要采用人工输入制导语句方法控制循环并行流水硬件结构自动映射所需启动间距信息的生成,该方法只能采用...
郭振华吴艳霞张国印戴葵李璐
关键词:自动映射
基于脉动阵列的HMMer加速系统
2013年
HMMer是用PHMM来对蛋白质或氨基酸序列查询进行分类和匹配的生物信息学软件工具包,但是由于HMMer的并行特性,HMMer在传统的串行化CPU平台上运行十分耗时。采用FPGA对HMMer的核心算法P7Viterbi进行加速,在P7Viterbi算法中存在一个限制并行性的多层循环的迭代间数据依赖关系,以前的工作都是忽略该循环反馈或者串行化这部分程序,从而导致精度和效率的降低。提出了一种基于FPGA的可以适应P7Viterbi的数据依赖特性的基于脉动阵列的并行运算结构,采用自动重算机制来解决阻碍计算并行的回边问题。在FPGA中通过并行流水技术实现的加速系统能够有效地提高HMMer的运算效率。实验结果表明,提出的带有20个运算单元的结构和IntelCore2Duo2.33GHzCPU平台相比,加速比能够达到56.8倍。
陆志坚吴艳霞郭振华孙延腾
关键词:脉动阵列
面向C2VHDL编译器的基本块级指针分析算法被引量:2
2013年
针对现有的C2VHDL编译器中指针编译技术所存在的缺陷,通过对传统指针分析算法进行研究,在基于低级虚似机(LLVM)面向CPU-FPGA应用的可重构编译器ASCRA架构上,设计并实现了一种以基本块为分析粒度的基于控制流图的流敏感上下文敏感指针分析算法。在可重构编译器ASCRA生成硬件VHDL程序时提供指针访存控制辅助信息。实验结果表明:在保证C2VHDL结果正确的前提下,该算法在简化了分析过程的同时,能够达到与流敏感指针分析相同的精度。与指针还原技术相比,该算法能够支持更多的指针数据类型。采用该算法的编译器ASCRA生成的硬件程序在硬件资源占用情况和运行速度两方面与指针还原技术相比都能够达到相同的硬件效果。
郭振华吴艳霞张国印杨杰顾国昌
关键词:计算机系统结构
面向类仿射型数组下标应用的参数化并行存储结构模板被引量:1
2016年
为了解决目前可重构编译技术在为类仿射型数组下标应用生成循环流水阵列时,生成的存储系统对数据并行与重用支持不完善的问题,本文提出了一种参数化并行存储结构模板.此模板采用模块化设计思想,根据数据访存特征生成由多体交叉并行存储子模块、单体串行存储子模块、RAW Buffer缓存子模块及Smart Buffer缓存子模块构成的存储结构.为灵活生成存储结构及充分挖掘数据的并行性和重用性,本文采用访存数据依赖图方法计算存储模板的参数值.和相关工作相比,根据本文提出的存储结构模板生成的硬件,可以在占用较少的硬件资源情况下,获得较高的硬件执行速度.
郭振华吴艳霞张国印戴葵
关键词:数据重用
共1页<1>
聚类工具0