邬贵明
- 作品数:30 被引量:49H指数:3
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 面向数据驱动处理器阵列的自动综合
- 本文提出了一种数据驱动处理器阵列结构,该结构能有效平衡存储和计算,适合用于在FPGA上实现高性能的算法加速,同时提出了一个面向该结构的自动综合框架,通过该框架可以将常规循环有效地映射到数据驱动处理器阵列上。实验结果表明了...
- 邬贵明窦勇王淼
- 关键词:阵列结构设计性能
- 文献传递
- 基于C6000的滑动窗口图像处理算法存储优化被引量:2
- 2009年
- 片外存储器和片内存储器的数据传输是数字信号处理系统性能提升的瓶颈。针对图像处理中的滑动窗口类问题,该文提出一种有效的存储调度优化方法,分为3步:预取数据到快速局部存储器,减少冗余读入及数据传输和处理重叠。在TMS320DM642DSP上应用了该方法,实验结果表明,与优化前相比加速比为30-70。
- 张帆窦勇邬贵明
- 关键词:图像处理
- 基于FPGA的列选主元LU分解方法
- 本发明公开了一种基于FPGA的列选主元LU分解方法,要解决的技术问题是降低LU分解的时间复杂度,加快稠密矩阵线性方程组的求解。技术方案是首先构建基于FPGA的由主处理单元和P个从处理单元组成的主从式并行计算系统,由主从式...
- 邬贵明窦勇夏飞姜晶菲周杰
- 文献传递
- 基于参数化存储结构的滑动窗口IP核自动生成被引量:3
- 2009年
- 为解决目前高级综合方法在处理滑动窗口程序时存在的存储系统设计瓶颈问题,提出了参数化存储体系结构模型.采用三级存储层次,充分开发内层循环、外层循环的数据重用;采用寄存器平移策略,简化硬件设计.与相关工作相比,这种体系结构模型使用相对较少的存储资源,将程序执行速度提高了2.13倍~3.8倍,将执行频率由相关工作的69MHZ提升到了238.7MHZ.
- 窦勇董亚卓徐进辉邬贵明
- 关键词:数据调度
- 支持循环自动流水线的粗粒度可重构阵列体系结构被引量:13
- 2008年
- 可重构计算兼顾定制计算的高效性与通用计算的灵活性,是人们正在探索的一类新型计算机体系结构.文中介绍一种粗粒度可重构多核协处理器体系结构,用于加速计算密集或数据密集类算法.在该结构中采用具有猜测执行机制的循环自动流水线技术,将流水线并行执行和数据驱动执行紧密结合.采用以循环程序为单位的固定指令多数据流执行模式,在循环执行期间,每个单元固定执行一种指令,配置信息量减少,支持快速动态重构.设计了多种特殊数据传递指令,如非平衡数据复制指令、数据选择指令等,充分利用循环迭代内部、循环迭代间的数据相关,开发数据重用性,减少对存储器带宽的需求.以大容量FPGA开发板为基础,构建了8×8规模的可重构阵列实验环境.多个计算密集型程序的实际运行结果表明,该体系结构在流水线吞吐率方面可以达到每拍1个循环迭代,访问存储器的请求数仅为典型RISC处理器的3%,并且具有单拍切换配置现场的能力.
- 窦勇邬贵明徐进辉周兴铭
- 关键词:可重构计算数据驱动
- Cholesky分解细粒度并行算法被引量:7
- 2010年
- 本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。
- 邬贵明窦勇王淼
- 关键词:CHOLESKY分解细粒度并行FPGA
- 二维DCT在粗粒度可重构处理器上的实现被引量:2
- 2008年
- 针对粗粒度可重构处理器的特点,提出一种二维离散余弦变换的设计方法,该方法在硬件资源受限的条件下,有效地挖掘了算法的并行性,结果证明算法在速度和资源利用率方面均达到了较好的状态,可满足实时图像编解码的要求。
- 徐佳庆邬贵明窦勇
- 关键词:二维离散余弦变换可重构处理器粗粒度
- 计算节点集群系统和数据中继器
- 本发明提供的一种计算节点集群系统和数据中继器。计算节点集群系统包括:多个计算节点,其中每个计算节点包括各自的FPGA和通用处理器;其中,各个计算节点的通用处理器通过网络相互连接;并且,在每个计算节点中,FPGA连接至通用...
- 谢向辉吴东郝子宇臧春峰原昊钱磊邬贵明李玺严忻凯
- 文献传递
- 对基于随机上下文无关文法的RNA二级结构预测进行加速的方法
- 本发明公开了一种对基于随机上下文无关文法的RNA二级结构预测进行加速的方法,目的是加快使用SCFG进行RNA二级结构预测的速度。技术方案是先构建由主机和可重构算法加速器组成的异构计算机系统,接着主机将格式化后的CM模型和...
- 夏飞窦勇姜晶菲周杰邬贵明雷元武
- SOC芯片系统可测性设计方法研究
- 本文对SOC芯片系统可测性设计进行了论述。基于核的SOC设计正在飞速发展,这种设计方法充分利用了设计的可重用性,从而得到了更短的开发周期.然而,SOC芯片系统的测试仍面临着巨大的挑战,同时SOC芯片系统可测性设计方法也成...
- 邬贵明窦勇
- 关键词:集成电路芯片设计电路测试
- 文献传递