黄立波
- 作品数:187 被引量:38H指数:4
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国防科技大学科研计划项目更多>>
- 相关领域:自动化与计算机技术电子电信理学交通运输工程更多>>
- 一种可配置的多进多出FIFO的设计方法及装置
- 本发明公开了一种多进多出FIFO,包括控制单元fifo_ctl和数据存储单元fifo_dp,控制单元fifo_ctl的输出端和数据存储单元fifo_dp之间连接有信号wren、读指针rptr和写指针wptr一共三组信号,...
- 王俊辉孙彩霞郑重郭维郭辉雷国庆隋兵才黄立波冯权友倪晓强王永文
- 用于乱序超标量处理器的操作依赖性调度方法、部件及处理器
- 本发明公开了一种用于乱序超标量处理器的操作依赖性调度方法、部件及处理器,本发明包括采用依赖性矩阵记录微操作之间的依赖信息,根据即将写回结果的微操作信息更新依赖性矩阵,选择就绪的微操作发射到各条执行流水线;在各条执行流水线...
- 刘广发王永文雷国庆邓全王俊辉郭维隋兵才倪晓强孙彩霞黄立波郑重郭辉
- 一种原子指令的执行方法和装置
- 本发明公开了一种原子指令的执行方法和装置,本发明方法包括将原子指令发送到Store流水线执行;非Cache一致性区域操作的原子指令发送到下一级存储中,并等待返回结果;Cache一致性区域的原子指令在Store流水线中获取...
- 郑重黄立波隋兵才王永文倪晓强孙彩霞王俊辉雷国庆郭维郭辉
- 文献传递
- 一种向量聚合装载指令的实现方法
- 本发明涉及微处理器设计技术领域,具体涉及一种向量聚合装载指令的实现方法,步骤包括:将向量聚合装载指令拆分为多个单元素的普通装载微操作;将拆分后微操作及相应的元素序号发往指令队列中;操作数准备好后,将单元素装载微操作发往存...
- 郑重王永文孙彩霞王俊辉隋兵才倪晓强雷国庆黄立波郭维郭辉
- 文献传递
- 运行时程序安全关键数据的完整性验证方法及装置
- 本发明公开了一种运行时程序安全关键数据的完整性验证方法及装置,方法步骤如下:1)在程序中指明安全关键变量,在编译时生成安全关键数据集合,加载程序时将程序的虚拟地址空间分为保护区域和非保护区域、将安全关键数据集合加载至保护...
- 王蕾邓宇王永文窦强李姗姗孙彩霞张承义高军黄立波倪晓强隋兵才陈微赵天磊
- 文献传递
- 面向现代GPU的Winograd卷积加速研究
- 2024年
- 卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,是目前卷积神经网络中的主流实现方法 .然而,Winograd卷积在许多高度优化的深度神经网络库和深度学习编译器中的实现比较低效.由于Winograd卷积的四个阶段的复杂数据依赖关系,面向GPU对其进行优化非常具有挑战性.本文针对现代GPU体系结构优化了Winograd卷积算子的性能.本文提出了Winograd计算阶段的等价变化及其利用Tensor Core进行计算的无同步实现,并进一步提出了利用不同GPU内存层级的部分计算核融合方法 PKF(Partial Kernel Fusion).基于张量虚拟机(Tensor Virtual Machine,TVM)和代码重构器PKF-Reconstructor(Partial Kernel Fusion Reconstructor),实现了高性能的Winograd卷积.对真实应用中卷积神经网络的卷积算子的评估表明,与cuDNN相比,本文所提算法实现了7.58~13.69倍的性能提升.
- 童敢黄立波吕雅帅
- 基于图形处理器的图计算边向量负载平衡方法及装置
- 本发明公开了一种基于图形处理器的图计算边向量负载平衡方法及装置,本发明方法包括定期找出所有SM核需要处理的边数据中的最多的和最少的数据量并计算差值,且差值超过预设阈值两个SM核的状态分别设置为等待捐赠负载状态和接收负载捐...
- 黄立波郭辉郑重郭维雷国庆王俊辉隋兵才孙彩霞王永文倪晓强
- 文献传递
- 兼容SIMD计算和浮点矩阵乘法的运算部件及其应用方法
- 本发明公开了一种兼容SIMD计算和浮点矩阵乘法的运算部件及其应用方法,运算部件包括可复用操作数堆的浮点和向量执行部件vfu0和vfu1,所述浮点和向量执行部件vfu0和vfu1均包括四个呈阵列状布置的乘加部件,四个乘加部...
- 邓全邱哲豪王永文隋兵才孙彩霞倪晓强黄立波郑重雷国庆王俊辉郭维郭辉
- 文献传递
- 一种分支目标预测地址在流水线中的传递方法和装置
- 本发明公开了一种分支目标预测地址在流水线中的传递方法及装置,本发明方法包括初始化预测地址队列的读写指针和队列空闲项数寄存器;在取指阶段,根据分支方向预测结果,将预测跳转的分支的目标预测地址写入预测地址队列,并更新队列写指...
- 孙彩霞邓全郭辉郭维雷国庆王俊辉郑重倪晓强黄立波隋兵才王永文
- 多通道与非型快闪并行存储控制器
- 本发明公开了一种多通道与非型快闪并行存储控制器,目的是提供一种能提供更高聚合带宽,数据读写可靠性高的存储控制器。本发明由交换结构模块和n个底层存储控制器组成,交换结构模块由请求队列、传输仲裁部件和交叉开关组成,对多通道的...
- 肖侬赖明澈黄立波刘芳陈志广欧洋
- 文献传递