索维毅
- 作品数:5 被引量:1H指数:1
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向异构SIMD扩展部件的自动向量化方法
- 本发明涉及高性能计算自动并行化领域,特别涉及一种面向异构SIMD扩展部件的自动向量化方法,适用于不同向量长度、不同向量指令集的异构SIMD扩展部件,设计一套虚拟指令集,能够在自动向量化统一架构下将输入的C和Fortran...
- 赵荣彩庞建民姚远刘鹏索维毅
- 文献传递
- 面向异构SIMD扩展部件的自动向量化方法
- 本发明涉及高性能计算自动并行化领域,特别涉及一种面向异构SIMD扩展部件的自动向量化方法,适用于不同向量长度、不同向量指令集的异构SIMD扩展部件,设计一套虚拟指令集,能够在自动向量化统一架构下将输入的C和Fortran...
- 赵荣彩庞建民姚远刘鹏索维毅
- 文献传递
- 面向DSP的自动向量化及优化技术研究
- 随着SIMD扩展部件的广泛应用,已知的运用微处理器SIMD扩展加速应用程序已经成为高性能计算机提高性能的重要手段,并且随着多媒体和数字信号处理应用的普及,其中许多嵌入式处理器都提供SIMD指令,如何能够充分利用这些SIM...
- 索维毅
- 关键词:DSPSIMDSLP
- 文献传递
- 基于跨基本块变换和循环分布的SLP优化技术
- 2013年
- 现有的SLP优化算法无法处理内层循环中存在的依赖环和归约,并且在基本块边界产生大量的冗余拆包和赋值语句,从而导致向量化效率不高。针对该问题,提出了一种基于跨基本块变换和循环分布的SLP优化算法。该算法以控制流图为基础,根据基本块间各数组变量的Define-Use关系以及跨越基本块之间的数据依赖关系进行跨基本块的向量化变换,有序地采用跨基本块变换和循环分布,尽可能发掘最内层循环基本块内语句的并行性,使SLP自动向量化编译器生成具有更多SIMD指令的向量化代码。实验结果表明,该算法能够隐藏更多跨基本块冗余操作的开销,同时利用跨基本块的数据依赖生成更优的SIMD指令,有效地提高了向量化程序的加速比。
- 索维毅赵荣彩姚远张小妹
- 关键词:SLP数据依赖控制流图
- 面向DSP的超字并行指令分析和冗余优化算法被引量:1
- 2012年
- 如今单指令多数据流(SIMD)技术在数字信号处理器(DSP)上得到了广泛的应用,现有的向量化编译器大多都实现了自动向量化的功能,但是编译器并不适合支持DSP为特征的SIMD自动向量化,主要由于DSP复杂的指令集、特有的寻址模型,以及依赖关系或者数据非对齐等原因而导致向量化效率不高。为了解决此问题,在基于Open64的超字并行(SLP)自动向量化编译系统后端,对SLP自动向量化中的指令分析和冗余优化算法进行了添加和改进,生成更加高效的向量化源程序。实验结果表明,该优化方法能有效提高DSP性能并降低功耗。
- 索维毅赵荣彩姚远刘鹏
- 关键词:数字信号处理器自动向量化