谭旭
- 作品数:5 被引量:12H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种多目的数据传输网路路由装置、方法、芯片、路由器
- 本发明提出一种多目的数据传输网路路由装置、方法、芯片、路由器,涉及多核或众核结构下片上网络的路由结构设计领域,该方法包括接收原始数据包,将目的地址相异数据相同的所述原始数据包进行合并,生成合并后的数据包,将所述合并后的数...
- 谭旭唐志敏叶笑春王达张浩
- 文献传递
- 一种多目的数据传输网路路由装置、方法、芯片、路由器
- 本发明提出一种多目的数据传输网路路由装置、方法、芯片、路由器,涉及多核或众核结构下片上网络的路由结构设计领域,该方法包括接收原始数据包,将目的地址相异数据相同的所述原始数据包进行合并,生成合并后的数据包,将所述合并后的数...
- 谭旭唐志敏叶笑春王达张浩
- 一种无回边数据流循环方法、系统、装置、芯片
- 本发明提出一种无回边数据流循环方法、系统、装置、芯片,涉及数据流体系结构技术领域,该方法设置数据流的循环指令的指令格式,所述指令格式包括操作码、源操作数个数、多个目的指令的编号、总循环次数段,每个循环指令维护一个迭代计数...
- 谭旭唐志敏叶笑春王达张浩
- 文献传递
- 基于网络负载特征感知的数据流指令调度机制研究被引量:2
- 2018年
- 研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。
- 冯煜晶欧焱叶笑春叶笑春范东睿唐志敏
- 关键词:网络负载
- 基于细粒度数据流架构的稀疏神经网络全连接层加速被引量:10
- 2019年
- 深度神经网络(deep neural network,DNN)是目前最先进的图像识别算法,被广泛应用于人脸识别、图像识别、文字识别等领域.DNN具有极高的计算复杂性,为解决这个问题,近年来涌出了大量可以并行运算神经网络的硬件加速器.但是,DNN中的全连接层有大量的权重参数,对加速器的带宽提出了很高的要求.为了减轻加速器的带宽压力,一些DNN压缩算法被提出.然而基于FPGA和ASIC的DNN专用加速器,通常是通过牺牲硬件的灵活性获得更高的加速比和更低的能耗,很难实现稀疏神经网络的加速.而另一类基于CPU,GPU的CNN加速方案虽然较为灵活,但是带来很高的能耗.细粒度数据流体系结构打破了传统的控制流结构的限制,展示出了加速DNN的天然优势,它在提供高性能的运算能力的同时也保持了一定的灵活性.为此,提出了一种在基于细粒度数据流体系结构的硬件加速器上加速稀疏的DNN全连接层的方案.该方案相较于原有稠密的全连接层的计算减少了2.44×~6.17×的峰值带宽需求.此外细粒度数据流加速器在运行稀疏全连接层时的计算部件利用率远超过其他硬件平台对稀疏全连接层的实现,平均比CPU,GPU和mGPU分别高了43.15%,34.57%和44.24%.
- 向陶然叶笑春李文明冯煜晶谭旭谭旭范东睿
- 关键词:数据重用