王达
- 作品数:24 被引量:9H指数:1
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 存储器内建自修复系统及自修复方法
- 本发明提供一种存储器内建自修复系统,包括内建自测试电路、内建自诊断电路、内建自修复电路和冗余行/列;其特征在于,所述内建自修复电路包括字修复电路,所述字修复电路含有冗余内容可寻址存储器,所述冗余内容可寻址存储器专用于修复...
- 谢远江王达胡瑜李晓维
- 文献传递
- 嵌入式RAM的故障诊断与自修复方法及电路设计
- 随着集成电路制造工艺向超深亚微米和纳米级推进,芯片集成度大幅提高,嵌入式随机访问存储器(RAM)逐渐成为集成电路芯片的主体。由于高密度嵌入式RAM的成品率直接影响着芯片的成品率,因此对嵌入式RAM进行故障诊断和修复,一直...
- 王达
- 关键词:故障诊断可测试性设计
- 面向串扰的时延测试方法
- 李华伟张旻晋张颖鄢贵海王达
- 随着VLSI工艺特征尺寸向超深亚微米、纳米级的持续推进,芯片内部速度不断增加,与性能相关的缺陷日趋严重,各种噪声效应引起的信号完整性问题对VLSI系统的性能产生重大影响,特别是互连线之间串扰带来的时延改变不容忽视,对于芯...
- 关键词:
- 关键词:网络路由器设计方法
- NDP-Ledger:面向区块链应用的通用高通量加速架构
- 2020年
- 区块链技术由于去中心化及不可篡改等特性,广泛应用于数字货币、支付交易等领域,其算法对计算能力和存储访问能力有较高要求,导致传统冯诺依曼结构在面向区块链应用时能效比较低。3D堆叠存储器因可以缓解冯诺依曼结构的访存瓶颈,成为了热门研究方向之一。本文基于3D堆叠存储器技术及数据流执行模式,提出了一种面向区块链应用的高通量近数据处理(NDP)架构,NDP-Ledger。本文深入分析和论证了区块链应用的计算特征及3D堆叠存储技术在区块链应用中的适应性问题,并基于数据流执行模式设计了一种通用的高并发区块链加速体系结构,使区块链加速器在满足通用性的前提下提高处理性能。模拟评估结果表明,本文提出的区块链通用加速器结构,在典型区块链应用处理方面的性能优于主流的CPU和GPU。
- 安述倩李文明李文明范志华吴萌王达张浩王达
- 关键词:区块链数据流
- 一种针对片上众核结构共享末级缓存的改进的LFU替换算法
- 为了得到更高的吞吐率和性能功耗比,众核处理器 (Manycore Processor) 摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核...
- 张轮凯宋风龙王达
- 面向数据流结构的指令内访存冲突优化研究被引量:1
- 2019年
- 神经网络等人工智能应用的迅速兴起给传统处理器的设计带来了巨大的挑战,粗粒度数据流架构因具有高指令并发和高通用性的特点成为研究热点.然而,由于粗粒度数据流结构处理单元采用随机访问存储器作为存储结构,加之神经网络中大部分运算数据具有密集型特点,造成大量的指令内操作数访存冲突.通过分析典型神经网络的访存行为,发现此类应用存在指令内操作数冲突,会引起计算部件利用率的降低.基于此分析,提出了灵活的数据冗余策略.在编译指令阶段,为指令内有访存冲突的操作数申请数据冗余空间,降低指令内操作数访存延迟.实验以典型的神经网络LeNet,AlexNet为基准测试程序.采用灵活的数据冗余策略之后,能耗比相对于Round-Robin和ReHash的无数据冗余策略分别提高了30.21%和12.37%,相比于2套全数据冗余策略能耗比提高了27.95%.
- 欧焱冯煜晶李文明叶笑春王达范东睿
- 关键词:数据冗余能耗比
- Flash存储器测试与修复方法概述
- Flash存储器作为一种非易失性存储器,由于其特有的低功耗、存储密度大等特性被广泛应用于各种便携式电子设备中。由于深亚微米工艺的不确定性,Flash存储器在生产过程中存在各种缺陷,从而导致存储器失效,成品率降低。如何有效...
- 王达胡瑜李晓维
- 关键词:FLASH存储器故障类型
- 文献传递
- 结合众核结构特征的运行时系统关键技术研究
- 范东睿张浩王达宋风龙叶笑春
- 真实的高性能计算应用需求除了要求具备高性能计算能力外,还要求能够简便而充分地利用片上大规模并行资源,即具备良好的可编程性的同时取得高性能。如何为片上众核处理器设计灵活高效的运行时管理系统,以有效地利用片上可集成的晶体管资...
- 关键词:
- 关键词:处理器设计方法
- 众核处理器高效片上访存机制研究
- 日益加剧的Memory Wall问题成为限制处理器性能进一步提高的主要因素之一,片上可配置SRAM可以更灵活地发挥和利用程序访存的局部性,从而引入众核处理器的设计当中。为充分发挥这种优势,针对片上可配置SRAM的访存队列...
- 范灵俊安述倩李杨张浩王达范东睿
- 关键词:矩阵乘
- 文献传递
- 基于粗粒度数据流架构的稀疏卷积神经网络加速被引量:7
- 2021年
- 卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).
- 吴欣欣欧焱李文明王达张浩范东睿