文梅
- 作品数:114 被引量:76H指数:5
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于合并同类项的矩阵乘法的运算核及芯片
- 本申请涉及一种基于合并同类项的矩阵乘法的运算核及芯片,主要包含数据复用的计算单元、数据映射单元以及基于加法树的多模式累加器。在不同精度模式下,该运算核的计算单元之间进行不同程度的数据复用,保证了最优的带宽利用率;并根据精...
- 文梅曹亚松沈俊忠李重行
- 面向VLIW和SIMD架构的编译器自动调试方法及系统
- 本发明公开了一种面向VLIW和SIMD架构的编译器自动调试方法及系统,本发明方法包括针对待校验程序进行语义正确性校验以判断待校验程序相对源程序是否存在语义错误,若语义正确性校验发现存在语义错误,则判定调试不通过,否则针对...
- 时洋邓灿陈照云文梅赵宵磊王家男王耀华扈啸
- 一种利用低空地面图像自动生成地面全景图的新方法
- 地面全景图的用途十分广泛,但是由于其对视觉效果和地理参考意义的要求,使得用低空地面图像来自动生成地面全景图面临诸多挑战。这些挑战主要来源于两点:<br> 拍摄高度较低,地表和地物不能看作在同一平面;使用低空...
- 黄达飞文梅伍楠任巨张春元
- 关键词:立体视觉图像拼接
- 高清H.264 变换编码的流式实现
- .264 作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm 处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264 对计算性能的要求,本文给出了高清H....
- 苏华友伍楠文梅任巨吴伟张春元
- 关键词:STREAMPROCESSORH.264CODINGTRANSFORMENCODINGSTREAM
- 共享存储可重构计算机软硬件通信的优化实现被引量:6
- 2013年
- 可重构硬件操作系统BORPH提供的硬件进程概念和以硬件为中心的执行模型可极大地提高可重构计算平台的易用性.BORPH-N为BORPH的扩展系统,主要的扩展是支持在共享存储可重构计算平台上的运行.BORPH-N为硬件进程提供基于共享存储、符合Unix语义的高性能进程间通信支持:共享存储和信号量.利用这两项服务,硬件进程可与系统中其他所有软件进程和硬件进程进行交互.可重构计算的重要目标是利用可重构逻辑对应用的耗时部分进行加速,所以软硬件交互机制的效率至关重要.通过类似远程调用这种简单方式来提供这两项服务,软硬件交互频繁,开销较大,性能难以满足需求.BORPH-N使用的优化策略基于独立执行的基本思路进行设计.实验结果表明,BORPH-N所需硬件开销较小,为硬件进程提供的共享存储和信号量的效率逼近硬件平台的峰值,可以满足实际应用的需求.
- 荀长庆杨乾明伍楠文梅张春元
- 关键词:可重构计算软硬件协同共享存储进程间通信
- 一种利用剩余资源分配寄存器的方法
- 本发明公开了一种利用剩余资源分配寄存器的方法,要解决的技术问题是在处理器寄存器分配过程中减小寄存器文件压力过载,减少溢出访存。技术方案是在寄存器分配失败后,首先构建剩余网络,然后选择平移变量,再对选定的平移变量选择合适的...
- 管茂林文梅伍楠张春元任巨何义荀长庆杨乾明吴伟
- 文献传递
- 一种支持可变分块的矩阵乘加速方法
- 本发明公开了一种支持可变分块的矩阵乘加速方法,步骤包括:输入矩阵A和矩阵B,根据矩阵A和矩阵B的规模确定子块大小S<Sub>i</Sub>,将矩阵A以规模为S<Sub>i</Sub>*N的子块为单位进行按行分块,将矩阵B...
- 文梅沈俊忠乔寓然杨乾明苏华友肖涛陈照云张春元
- 以编译为导向的Matrix-DSP程序分析与优化被引量:2
- 2020年
- 数字信号处理器(DSP)在图像处理、自动化控制、信号处理等多个领域具有广泛应用。自主研发的Matrix DSP采用了典型的单指令多数据SIMD+超长指令字VLIW的向量化架构,因此面向该架构如何实现高效的向量化编程与优化是一项重要挑战。基于Matrix DSP的体系结构特点,以编译器性能为导向,对内核级代码常用的分析优化手段进行梳理和总结,并结合一个通用矩阵乘的例子进行展示,其执行性能可最高提升1个数量级。最后,从编译器优化和程序员高效编程的角度提出了一些后续的思考与讨论。
- 荀长庆陈照云文梅孙海燕马奕民
- 关键词:编译器
- 面向GPDSP的轻量级高效汇编代码编程方法及系统
- 本发明公开了一种面向GPDSP的轻量级高效汇编代码编程方法及系统,本发明包括:输入串行汇编代码,所述串行汇编代码由指令串行构成,其中指令排布的顺序表示指令执行和生效的顺序,且每一条指令不包含有效的并行符号以及功能单元信息...
- 陈照云文梅马奕民时洋孔玺畅扈啸王耀华孙海燕邓灿赵宵磊
- 面向飞腾迈创DSP的自主软件栈设计
- 2024年
- 飞腾迈创DSP是国防科技大学计算机学院为了突破卡脖子技术,解决我国相关重点领域内芯片长久受制于人的现实问题而自主设计的高性能数字信号处理器。由于该系列芯片采用全自主设计的指令集,无法兼容已有的软件,一套自主完备且高效的软件栈是决定飞腾迈创DSP生命力的关键。基于团队长期以来的持续工作,系统阐述了飞腾迈创DSP软件栈的设计原则与层次化架构,重点介绍了包括支持层、编译层以及工具层在内的相关软件工具的创新功能、实现方法以及性能。同时,结合用户的反馈与团队的思考,还讨论了飞腾迈创DSP软件栈未来需要探索的相关问题。
- 时洋陈照云孙海燕王耀华文梅扈啸
- 关键词:DSP编译器调试器