您的位置: 专家智库 > >

国家自然科学基金(60873112)

作品数:5 被引量:6H指数:1
相关作者:刘鹏姚庆栋蔡卫光江国范顾雄礼更多>>
相关机构:浙江大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划霍英东教育基金更多>>
相关领域:自动化与计算机技术轻工技术与工程建筑科学电子电信更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 4篇自动化与计算...
  • 1篇电子电信
  • 1篇建筑科学
  • 1篇轻工技术与工...

主题

  • 1篇调度
  • 1篇多线程
  • 1篇多线程处理
  • 1篇多线程处理器
  • 1篇信号
  • 1篇信号处理
  • 1篇任务调度
  • 1篇实时操作系统
  • 1篇数据相关
  • 1篇数据相关性
  • 1篇数据转发
  • 1篇系统实现研究
  • 1篇系统芯片
  • 1篇线程
  • 1篇芯片
  • 1篇MULTIP...
  • 1篇NEW_ME...
  • 1篇RTOS
  • 1篇SOC
  • 1篇SPL

机构

  • 3篇浙江大学

作者

  • 3篇姚庆栋
  • 3篇刘鹏
  • 2篇蔡卫光
  • 1篇成杏梅
  • 1篇张奇
  • 1篇顾雄礼
  • 1篇张贻雄
  • 1篇江国范

传媒

  • 2篇浙江大学学报...
  • 1篇电子与信息学...
  • 1篇Journa...
  • 1篇Journa...

年份

  • 2篇2010
  • 3篇2009
5 条 记 录,以下是 1-5
排序方式:
New method for high performance multiply-accumulator design被引量:1
2009年
This study presents a new method of 4-pipelined high-performance split multiply-accumulator (MAC) architecture, which is capable of supporting multiple precisions developed for media processors. To speed up the design further, a novel partial product compression circuit based on interleaved adders and a modified hybrid partial product reduction tree (PPRT) scheme are proposed. The MAC can perform 1-way 32-bit, 4-way 16-bit signed/unsigned multiply or multiply-accumulate operations and 2-way parallel multiply add (PMADD) operations at a high frequency of 1.25 GHz under worst-case conditions and 1.67 GHz under typical-case conditions, respectively. Compared with the MAC in 32-bit microprocessor without interlocked piped stages (MIPS), the proposed design shows a great advantage in speed. Moreover, an improvement of up to 32% in throughput is achieved. The MAC design has been fabricated with Taiwan Semiconductor Manufacturing Company (TSMC) 90-nm CMOS standard cell technology and has passed a functional test.
Bing-jie XIAPeng LIUQing-dong YAO
关键词:PIPELINECOMPRESSOR
基于提前写回策略的数据转发优化方法
2010年
针对深度流水线和复杂指令集结构,给出一种基于操作数访问时序的数据转发模型,使用5个参数描述指令执行过程,并以一种RISC/DSP结构MediaDSP64原型机为例进行分析.在分布式转发电路的基础上,提出一种基于提前写回策略的转发优化方法.该策略在不影响指令执行效率的前提下,通过将DSP指令中辅助寄存器的结果提前写回寄存器文件减少了转发源的数量.针对该方法造成的指令乱序执行情况,设计一种影子寄存器结构,保证了精确异常处理的实现.实验结果表明,转发电路的硬件资源占用减少了43.8%,关键路径延时下降了19.8%.
蔡卫光姚庆栋刘鹏张奇张贻雄
RISC-DSP处理器中指令数据相关性的提前判断方法被引量:1
2010年
RISC-DSP处理器中执行周期数动态可变的指令对数据相关检测造成了困难。该文通过分布式相关检测模型将检测操作转换为依赖关系集合的计算,推测不同流水线状态下后一周期中的依赖关系集合,并根据当前指令相关性和功能单元发出的信号确定当前流水线状态,从而提前判断出下一周期中的指令相关性。按照其集合操作的特点进行逻辑优化,并以所研制的RISC-DSP处理器MediaDSP64原型机为例进行电路实现。综合结果表明,在对整体电路资源和功耗影响较小的前提下,从原先流水线关键路径中隐藏了相关检测电路,其延时下降了约30%。
蔡卫光姚庆栋刘鹏
关键词:信号处理
支持多线程处理器的实时操作系统实现研究被引量:3
2009年
考虑到多线程处理器开发对实时操作系统的需求,结合其硬件特点,对已有的实时操作系统进行修改,给出了多线程处理器的操作系统实现.这种处理在充分利用多线程技术特点的同时,还可以保留原有实时操作系统的性能优势.以MPEG-1解码系统为例,给出了其在媒体系统芯片和多线程处理器上基于实时操作系统的任务调度实现.实验结果表明,提出的操作系统实现方案充分利用了多线程技术,能够提升系统的实时性能,降低实时操作系统的管理开销,并简化终端程序员的编程工作.
成杏梅刘鹏顾雄礼江国范姚庆栋
关键词:多线程实时操作系统系统芯片任务调度
AN OBJECT ORIENTED MODEL SCHEDULING FOR MEDIA-SOC被引量:1
2009年
This paper proposes an object oriented model scheduling for parallel computing in media MultiProcessors System on Chip(MPSoC).Firstly,the Coarse Grain Data Flow Graph(CGDFG) parallel programming model is used in this approach.Secondly,this approach has the feature of unified abstraction for software objects implementing in processor and hardware objects implementing in ASICs,easy for mapping CGDFG programming on MPSoC.This approach cuts down the kernel overhead and reduces the code size effectively.The principle of the oriented object model,the method of scheduling,and how to map a parallel programming through CGDFG to the MPSoC are analyzed in this approach.This approach also compares the code size and execution cycles with conventional control flow scheduling,and presents respective management overhead for one application in me-dia-SoC.
Cheng XingmeiYao YingbiaoZhang YixiongLiu PengYao Qingdong
共1页<1>
聚类工具0