您的位置: 专家智库 > >

张庆花

作品数:5 被引量:5H指数:2
供职机构:解放军信息工程大学更多>>
发文基金:国家科技重大专项国家高技术研究发展计划国家重点实验室开放基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 3篇向量
  • 3篇并行化
  • 2篇自动并行化
  • 1篇代码
  • 1篇代码生成
  • 1篇试运行
  • 1篇数据重组
  • 1篇向量化
  • 1篇距离向
  • 1篇距离向量
  • 1篇反馈式编译
  • 1篇非规则
  • 1篇GCC
  • 1篇插桩

机构

  • 5篇解放军信息工...

作者

  • 5篇张庆花
  • 4篇赵荣彩
  • 2篇高伟
  • 2篇王鹏翔
  • 2篇李朋远
  • 2篇张素平
  • 2篇丁丽丽
  • 1篇李雁冰
  • 1篇于海宁

传媒

  • 3篇计算机科学
  • 1篇小型微型计算...
  • 1篇信息工程大学...

年份

  • 1篇2018
  • 1篇2017
  • 2篇2016
  • 1篇2015
5 条 记 录,以下是 1-5
排序方式:
一种支持跨幅访存的向量化代码生成方法
2015年
随着SIMD扩展部件的迅速发展,自动向量化工具已逐渐成熟。现阶段的工具能对连续访存程序进行较好的处理,然而,大部分非连续访存的多媒体程序并不能被转换为高效的向量化代码。提出并实现了一种支持跨幅访存的向量化代码生成方法,其利用目标系统已有的基本数据处理指令实现多个向量间的任意重组来解决含有非连续访存语句的向量化代码生成问题。经过实验分析和验证,提出的代码生成方法能够将含有跨幅访存的语句转化为面向目标系统的高效向量化代码,以提高程序执行效率。
李朋远赵荣彩高伟高伟
关键词:代码生成向量化数据重组
循环展开技术在向量程序中的应用被引量:2
2016年
循环展开是一项常用的循环优化技术。当前针对串行程序的循环展开技术已经比较成熟,但是在实际应用中没有针对向量程序进行有效的循环展开。为了解决这个问题,提出了一种面向向量程序的循环展开技术。首先,针对向量寄存器压力和代码膨胀等限制因素,提出了一种自动计算展开因子的CUFVL算法;其次,根据向量循环展开的特点,制定了完全展开策略;最后结合CUFVL算法和完全展开策略,设计了向量循环展开的总体流程。实验结果表明,该方案能够计算出合适的展开因子,进而对向量程序进行适当的循环展开或完全展开,从而有效提升应用程序的性能。
高伟赵荣彩于海宁张庆花
分支嵌套循环的自动并行化研究被引量:3
2017年
GCC编译器是一种受广大研究者青睐的开源优化编译器,但它仅仅能够对完美嵌套循环进行依赖分析。为了更好地挖掘嵌套循环粗粒度的并行,深入研究了GCC5.1数据依赖分析过程,提出了一种能够处理分支嵌套循环的依赖测试方法。首先识别出分支嵌套循环,然后分析数组下标与分支嵌套循环外层索引变量的关系,最后计算出外层循环索引变量的距离向量,并通过检测距离向量判断循环是否存在依赖。实验结果表明,该方法能够正确、有效地分析出分支嵌套循环的依赖关系。
丁丽丽李雁冰张素平王鹏翔张庆花
关键词:GCC距离向量
一种面向规则DOACROSS循环的自动并行化框架
2016年
针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次提出了明确的同步控制机制来实现不同线程间的通信;最后,本文设计了一种基于程序执行开销的流水粒度求解算法,以达到降低程序并行过程中的同步开销目的.本文将该方法在SW-VEC自动并行化系统中实现并加以验证,实验结果表明本文所提方法对FDR波前计算循环和NPB3.3.1中的LU课题有明显性能提升.
张庆花赵荣彩李朋远
面向非规则Doacross循环的反馈式编译框架
2018年
非规则Doacross循环包含复杂数据流以及控制流引起的不确定依赖关系,传统并行化技术对其采取保守处理,错失不少并行机会。文章提出一种面向非规则Doacross循环的反馈式编译方法,利用程序运行时的剖面信息指导自动并行化工具进行并行化。通过插桩和试运行的方式得到程序的上下文信息,反馈给并行化工具,利用反馈信息构建程序依赖图,进而对程序进行并行化。实验结果表明该方法对测试用例有明显的性能提升。
张庆花赵荣彩张素平丁丽丽王鹏翔
关键词:并行化插桩试运行
共1页<1>
聚类工具0