伍楠
- 作品数:63 被引量:41H指数:4
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 流处理器MASA-I在FPGA上的实现被引量:5
- 2008年
- 流处理器与传统微处理器相比具有更高的性能和效率,已广泛应用于图像处理、媒体处理等领域。本文基于Altera EP2S180 FPGA芯片设计并实现了一款32位异构多核流处理器MASA-I,并对其硬件开销及性能进行了评估。结果表明,基于流处理的异构多核系统能够在FPGA上较好地实现,满足了流应用的需求。
- 杨乾明伍楠何义荀长庆张春元
- 关键词:流处理器FPGAMPEG
- 一种流处理器体系结构MASA及其在流体力学计算中的评测被引量:5
- 2008年
- 提出了面向科学计算的64位流体系结构——MASA,它具有强局域性、并行性、解耦合访存操作和计算操作等特征,特别适合于计算密集型的并行应用.作者使用时钟精确的模拟器评测了流体力学中的典型应用在MASA上的运行性能,结果表明MASA在500MHz的情况下能够获得比1.6GHz的Iantium2近4倍的加速,证实了流体系结构在高性能计算领域的极大潜力.
- 伍楠文梅何义荀长庆任巨柴俊张春元
- 关键词:流处理器体系结构
- 面向高性能计算的流VLIW编译技术研究被引量:1
- 2008年
- 本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序中的并行性,具有较高的效率。
- 管茂林伍楠文梅吴伟柴俊张春元
- 关键词:流处理器VLIW
- 一种基于FPGA的DDR3 SDRAM控制器设计与实现
- 本文介绍了DDR3 SDRAM的基本特点以及工作过程,给出了一种结合AlteraALTMEMPHY IP的DDR3 SDRAM控制器的设计方法,介绍了DDR3 SDRAM控制器的基本结构和设计思想,对各个功能模块进行了详...
- 孟晓东伍楠邢座程
- 关键词:FPGADDR3SDRAM控制器
- 文献传递
- 一种利用剩余资源分配寄存器的方法
- 本发明公开了一种利用剩余资源分配寄存器的方法,要解决的技术问题是在处理器寄存器分配过程中减小寄存器文件压力过载,减少溢出访存。技术方案是在寄存器分配失败后,首先构建剩余网络,然后选择平移变量,再对选定的平移变量选择合适的...
- 管茂林文梅伍楠张春元任巨何义荀长庆杨乾明吴伟
- 文献传递
- 流体系结构指令存储器优化设计研究被引量:3
- 2012年
- 针对流体系结构中VLIW代码体积对指令存储器的容量和功耗带来的问题,本文通过分析流处理器的指令特征,提出了一种新的VLIW分域压缩技术.在此基础上,本文为流体系结构设计了分布式的片上指令存储器,并提出了SIMD流水的执行模式.实验结果证明,该技术减少了38%的片外指令访存,降低约65%的片上指令存储器空间需求;分布式指令存储器减少了约37%的片上指令存储器面积,使得MASA的系统面积降低了8.92%,并降低了61%的指令存储器功耗.
- 管茂林何义杨乾明张春元伍楠
- 关键词:流体系结构
- 源路由胖树网络路由生成验证与查询方法研究被引量:2
- 2013年
- 路由生成是构建源路由胖树互连网络的重要步骤之一。针对源路由胖树网络路由生成问题,采用面向对象的方法,首先建立胖树网络的拓扑结构模型并提出分段路由方法,接着研究路由生成、正确性验证、路径查询的相关算法,最后探讨路由生成验证与查询软件的设计与实现。目前,该软件已经成功应用于多个源路由胖树网络的路由生成和故障路径诊断过程中。
- 曹继军王克非伍楠
- 关键词:互连网络源路由胖树路由表
- H.264运动估计算法在Imagine流处理器上的加速实现被引量:2
- 2006年
- 鉴于Imagine流处理器在媒体处理领域取得的优越性能,我们将H.264视频编码中耗时较大的运动搜索算法映射到Imagine上,利用流处理的思想充分开发其并行性来提高编码性能,对QCIF图像编码可达372fps,加速效果是非常明显的。由此证明,H.264是适于Imagine实现的。
- 李海燕文梅伍楠李礼荀长庆张春元
- 关键词:H.264视频编码
- 用于数据链路层的并行自测试装置及其方法
- 一种用于数据链路层的并行自测试装置及其方法,该装置包括BIST使能模块、链路状态模块、控制模块、BIST控制器、BIST启动/停止报文产生器、BIST测试模式产生器、BIST序列报文封装器、BIST序列报文去封装器、BI...
- 王永庆徐炜遐王克非刘路肖灿文沈胜宇戴艺庞征斌张磊曹继军张鹤颖高蕾伍楠
- 文献传递
- 片内多处理器局部cache一致性的双环监听方法
- 本发明公开了一种片内多处理器局部cache一致性的双环监听方法,目的在于对现有片内多处理器间局部cache一致性方案进行改进,解决访问结点个数受限和局部cache一致性造成的访问冲突等问题。技术方案是其总体结构除含有多个...
- 张春元鲁建壮王志英戴葵沈立伍楠李礼赵学秘岳虹
- 文献传递