王慧丽
- 作品数:19 被引量:123H指数:2
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学建筑科学更多>>
- DSP中仿真/测试的流水线控制方法
- FT-Matrix DSP是国防科技大学完全自主创新研制的高性能DSP,其指令流水线包括取指、派发、译码和执行四个阶段:取指部分包括PG、PW、PQ三站;派发最大支持10条指令并行派发;译码站主要进行指令码翻译和操作数准...
- 王慧丽孙永节万江华刘蓬侠
- 文献传递
- 面向向量处理器的二维矩阵卷积的向量化实现方法
- 一种面向向量处理器的二维矩阵卷积的向量化实现方法,步骤为:S1:通过DMA控制器将卷积矩阵A和卷积核矩阵B分别搬运到向量存储单元和标量存储单元;S2:将卷积矩阵A的一行元素和卷积核矩阵B的一个元素广播后对应的一行元素一一...
- 郭阳张军阳刘仲扈啸王慧丽胡敏慧王子聪
- 文献传递
- 面向向量处理器的基于SIMD的平均值值池化并行处理方法
- 一种面向向量处理器的基于SIMD的平均值值池化并行处理方法,其步骤为:S1:设定池化矩阵和池化窗口;S2:根据池化窗口尺寸k,取池化矩阵A的前k行元素进行相应的累加操作,得出前k行元素对应的列和;S3:配置混洗模式并进行...
- 郭阳张军阳扈啸王慧丽胡敏慧王子聪
- 文献传递
- 一种面向GPDSP的反卷积矩阵的向量化实现方法
- 本发明公开了一种面向GPDSP的反卷积矩阵的向量化实现方法,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,...
- 郭阳张军阳扈啸王慧丽胡敏慧王子聪
- 基于通用向量DSP的深度学习硬件加速技术被引量:3
- 2019年
- 随着深度学习在众多领域发挥着越来越重要的作用,如何设计高性能、低功耗、低延迟的深度学习硬件加速器成为体系结构领域的研究热点.本文基于深度学习算法模型的结构和优化方法,分析了深度学习硬件实现中面临的困难和挑战,并对比当前主流的深度学习硬件加速平台的优势和不足,提出了基于飞腾–迈创通用向量DSP的深度学习硬件加速方案,对其向量广播、矩阵转换等加速技术进行了阐述.并围绕目前通用向量DSP硬件加速的不足,对兼顾通用向量计算和专用深度学习计算的可重构计算阵列等优化技术进行了深入的探讨与研究.
- 王慧丽郭阳屈婉霞
- 关键词:体系结构硬件设计加速器
- 一种面向GPDSP的反卷积矩阵的向量化实现方法
- 本发明公开了一种面向GPDSP的反卷积矩阵的向量化实现方法,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,...
- 郭阳张军阳扈啸王慧丽胡敏慧王子聪
- 文献传递
- 一种基于参考模型的GPDSP指令流控自动验证方法被引量:1
- 2021年
- 随着科学计算和人工智能算法复杂度的增加,作为硬件设计中的控制中心,指令流控部件的设计面临复杂性和精确性急剧提升的挑战。FT-xDSP是国防科技大学自主研发的一款64位GPDSP处理器,其指令流控部件的设计规模和复杂性大幅增加,使得指令流控部件的验证成为一个突出难题。提出一种基于指令重排参考模型的指令流控自动化验证方法:首先,以指令输入输出关系为主要特征建立流控部件的抽象模型,屏蔽了内部复杂逻辑,在保证分析结果准确性的基础上降低了分析复杂度;其次,通过自动生成带约束的随机测试激励,对参考模型和待测设计结果进行自动化比较分析,在验证代价相当的情况下提升了代码覆盖率和功能覆盖率。实验和实际应用结果表明,该方法能针对指令流控验证中的薄弱点进行定向随机验证,大幅度提升了指令流控部件的验证效率和验证完整性。
- 王慧丽郭阳
- 关键词:参考模型
- 一种基于PLI技术的系统级验证方法
- 的系统级调试与验证的方法,是以软硬件联合的FPGA原型验证,但是长期以来该方法一直存在错误定位困难、源代码修改不便与验证迭代周期长等不足.为了改善FPGA原型验证的以上缺点,本文设计并实现了一种基于PLI技术的系统级验证...
- 李睿婷万江华刘衡竹王慧丽
- 关键词:芯片系统级验证
- 深度学习相关研究综述被引量:118
- 2018年
- 为了能够及时跟踪深度学习技术的最新研究进展,把握深度学习技术当前的研究热点和方向,针对深度学习技术的相关研究内容进行综述。首先介绍了深度学习技术的应用背景、应用领域,指出研究深度学习技术的重要性,以及当前重要的几种神经网络模型及两种常用大规模模型训练并行方案,其目的在于从本质上理解深度学习的模型架构及其优化技巧。对比分析了当下主流的深度学习软件工具和相关的工业界研究平台,旨在为神经网络模型的实际使用提供借鉴;详细介绍了当下几种主流的深度学习硬件加速技术和最新研究现状,并对未来研究方向进行了展望。
- 张军阳王慧丽郭阳扈啸
- 关键词:神经网络硬件加速
- 支持仿真/调试的指令派发部件设计与实现
- 数字信号处理器(Digital Signal Processor, DSP)作为电子系统的核心,已经广泛应用到了航天、航空、雷达、通信、家用电器等各个领域。随着对DSP信号采集和处理的速度及数据量的要求越来越高,DSP集...
- 王慧丽
- 关键词:DSPVLIW