您的位置: 专家智库 > >

国家教育部博士点基金(20059998026)

作品数:17 被引量:61H指数:4
相关作者:陈书明扈啸刘祥远孙书为汪东更多>>
相关机构:国防科学技术大学更多>>
发文基金:国家教育部博士点基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 17篇期刊文章
  • 1篇会议论文

领域

  • 12篇自动化与计算...
  • 6篇电子电信

主题

  • 5篇多核
  • 5篇处理器
  • 3篇多核处理
  • 3篇多核处理器
  • 3篇TRACE
  • 3篇CABAC
  • 2篇调度
  • 2篇多核DSP
  • 2篇异步
  • 2篇同步器
  • 2篇熵编码
  • 2篇共享存储
  • 2篇分簇
  • 2篇超长指令字
  • 2篇高性能
  • 1篇代码
  • 1篇调度算法
  • 1篇调优
  • 1篇定制
  • 1篇定制设计

机构

  • 17篇国防科学技术...

作者

  • 17篇陈书明
  • 5篇扈啸
  • 4篇刘祥远
  • 3篇孙书为
  • 2篇汪东
  • 2篇马鹏勇
  • 2篇陈莉丽
  • 2篇李杰
  • 1篇陈小文
  • 1篇刘春林
  • 1篇万江华
  • 1篇胡定磊
  • 1篇刘胜
  • 1篇陈胜刚
  • 1篇王耀华
  • 1篇孙锁林
  • 1篇李振涛

传媒

  • 7篇计算机工程与...
  • 4篇计算机研究与...
  • 3篇电子学报
  • 1篇计算机学报
  • 1篇国防科技大学...
  • 1篇计算机工程与...

年份

  • 4篇2009
  • 9篇2008
  • 5篇2007
17 条 记 录,以下是 1-10
排序方式:
面向多核片上Trace数据流合成的队列调度算法设计及实现被引量:3
2008年
多核片上Trace数据流包含各处理器核中用于调试的实时运行信息,经由专用数据通路和输出管脚传输.用于多Trace数据流合成的队列调度算法是影响片上Trace系统性能的关键技术之一.针对Trace数据流合成的特点,提出一种基于服务请求门限和最小服务粒度双重约束的懒惰队列调度算法.该算法通过设置各队列的服务请求门限控制队长分布,通过设置最小服务粒度和懒惰服务切换减少队列切换开销.提出基于溢出的缓冲利用率指标,用于评价调度算法设置队列优先级的实际效果.实验结果表明,能够按设置的队列优先级充分利用缓冲容量,有效降低各缓冲队列的溢出.用Verilog硬件设计语言实现了该算法并进行逻辑综合.同某主流算法比较,面积增加2015μm2,平均溢出率降低30%.
扈啸陈书明
关键词:多核处理器调度算法
多核处理器YHFT-QDSP的调试系统被引量:4
2008年
YHFT-QDSP是一款多核处理器。为满足其并发调试和实时调试的需要,在原有单核调试系统的基础上设计实现了多核同步调试系统和片上实时追踪系统(片上Trace)。多核同步调试提供了命令广播和断点同步触发等并发程序协同调试的功能;片上Trace通过专用硬件记录程序执行路径和数据读写等信息实现非入侵实时调试。本文从原理、结构和软硬件实现等方面介绍了该调试系统。
扈啸李杰陈莉丽陈书明
关键词:多核处理器
DSCF:一种面向共享存储多核DSP的数据流分簇前向技术被引量:2
2008年
多核数字信号处理器(DSP)的性能常常受限于共享存储的长延迟Cache一致性访问.数据前向(forwarding)技术是隐藏长延迟访问的一种有效手段.根据多核DSP应用的两类重要特征,提出了一种面向共享存储多核DSP结构的数据流分簇前向技术DSCF(data stream clustered forwarding).DSCF方法的主要特点是:兼容基本的共享存储Cache一致性协议;不污染目标Cache;数据的传输速度能够与消费速度相匹配;系统结构的可扩展性好.典型测试程序的模拟评测表明,采用DSCF方法能够将Cache一致性失效率平均降低44%,将系统总体性能提升30%~70%.
汪东陈书明
关键词:多核DSPCACHE一致性数据流
高性能VLSI设计中时钟分布网络的问题与解决方法被引量:2
2007年
本文介绍了深亚微米工艺下高性能VLSI芯片中时钟分布网络设计所面临的问题,总结了时钟分布网络设计的一般方法,最后指出了时钟分布网络设计研究的发展方向。
刘祥远陈书明
关键词:抖动功耗时钟树
CABAC熵编码机制下有效的变换域码率估计技术被引量:2
2008年
CABAC是H.264/AVC视频压缩标准中采用的一种熵编码机制,结合RDO模式选择技术,可以降低20%的码率.在RDO模式选择过程中,需要对编码块的每一种候选模式进行熵编码以获得编码位数,这在很大程度上增加了视频编码的计算复杂度.为了避免复杂的Lagrange耗费计算,本文第一次提出了一种CABAC熵编码机制下的变换域码率估计方法,基于量化变换系数和运动向量差对熵编码位数进行估计.在此基础上,本文将码率估计技术应用在RDO模式选择中,提出了基于码率估计的快速模式选择算法,减少了模式选择的计算时间.模拟结果显示,本文提出的CABAC熵编码机制下的变换域码率估计技术在对编码性能影响不大的情况下,减少了模式选择中51%的率失真耗费计算时间,采用全搜索运动估计算法时,节省33%的总编码时间.
孙书为陈书明刘祥远
关键词:CABAC熵编码
一种高性能的异步FIFO结构被引量:10
2007年
针对现有FIFO设计方法的不足,本文提出一种新的异步FIFO结构——WG-FIFO,采用加权Gray码进行指针编码,采用实时状态检测器控制写/读操作.模拟结果表明,在FIFO深度为4~16的情况下,该结构与已有的FIFO结构相比在性能、面积开销以及写/读操作效率等方面都获得了明显的改善.特别地,当FIFO的深度为8、宽度为32时,相比B-FIFO,WG-FIFO的最高时钟频率提高31.6%,单元面积减少17.1%,且写/读效率最大能提高47%.
刘祥远陈书明
关键词:高性能格雷码异步同步器
基于超块的统一分簇与模调度被引量:1
2007年
超长指令字处理器为了提高指令集并行(ILP)往往采用多个功能单元,从而需要多端口的寄存器文件提供支持.但是寄存器文件会随着端口的增多变得更复杂,频率难以提升,成为系统的瓶颈.分簇是解决这一问题的有效手段.分簇在不影响处理器ILP的前提下减少了每簇寄存器文件的端口数目,但对编译器提出了挑战,编译器必须将指令和操作数在簇间进行合理分配才能得到较好的指令级并行.针对分簇超长指令字结构提出了一种基于超块的统一分簇与模调度编译方法.使用超块技术可以增大调度范围以获得更好的ILP,并且可以处理含有控制流的循环体,增加了模调度的适用范围.超块中指令的分簇与模调度则是统一进行的,这将比分阶段进行有更好的优化效果,因为统一进行是从全局的角度寻求优化而非寻求各个阶段局部优化.在YHFT-DSP/700编译器中的实验结果表明,与ITSS算法相比,该算法可以达到较好的优化效果.
胡定磊陈书明刘春林
关键词:超长指令字编译器分簇模调度指令级并行
双簇结构DSP的数据Cache优化
2008年
数字信号处理常常包含大量数据运算,这使得数据Cache成为影响其性能的关键因素。特别是对于我们研制的双簇VLIW结构YHFT DSP系列处理器,Cache的失效会导致整个内核八条流水线同时停顿。所以,减小Cache失效延迟能给处理器性能带来显著的提升。本文研究的主要问题是如何针对一级数据Cache的读失效操作进行优化,从四个方面进行,分别为提前发读请求、请求字优先、合并并行失效读和后台处理Snooping。模拟结果表明,采用这些优化措施后,处理器的性能提高了8.36%。
马鹏勇陈书明孙锁林
关键词:数字信号处理器高速缓存超长指令字
多级存储系统中跨边界访问实现策略研究
2008年
跨边界访问问题是现代计算机必须解决的一个基本问题。主要介绍了跨边界访问问题出现的原因和背景,以及主流的实现跨边界访问的技术,并从效率、软硬件开销、实现的复杂性等方面分析了这些技术的优缺点,在此基础上,提出一种在多级存储系统基础之上的高效低开销的解决方案,该方案能够在较小的软硬件开销下高效地解决跨边界访问问题。
刘胜陈书明
关键词:拆分
带定向通路的十读六写寄存器文件全定制设计被引量:1
2008年
本文介绍了一个带定向通路的十读六写寄存器文件在0.18μmCMOS工艺下的全定制设计,与基于标准单元半定制寄存器文件相比,面积和功耗都缩小了近一半,延迟从2.34ns减小为1.2ns。在建立视图时,通过采用伪时序建模的方法大大减小了建模的工作量。该设计已运用于YHFT系列DSP芯片中。
马鹏勇李振涛陈书明
关键词:全定制寄存器文件
共2页<12>
聚类工具0