您的位置: 专家智库 > >

国家自然科学基金(61173007)

作品数:5 被引量:23H指数:2
相关作者:范东睿宋风龙王达叶笑春刘高辉更多>>
相关机构:中国科学院中国科学院大学西安理工大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划创新研究群体科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 3篇处理器
  • 2篇上网
  • 2篇片上网络
  • 2篇网络
  • 2篇核结构
  • 1篇多核
  • 1篇多核结构
  • 1篇能耗
  • 1篇能耗优化
  • 1篇能效
  • 1篇嵌入式
  • 1篇嵌入式系统
  • 1篇全局自适应
  • 1篇自适
  • 1篇自适应
  • 1篇路由
  • 1篇路由机制
  • 1篇模拟器
  • 1篇末级
  • 1篇缓存

机构

  • 5篇中国科学院
  • 2篇西安理工大学
  • 2篇中国科学院大...
  • 1篇河北农业大学
  • 1篇中国科学院研...
  • 1篇国网信息通信...

作者

  • 3篇范东睿
  • 2篇刘高辉
  • 2篇叶笑春
  • 2篇宋风龙
  • 2篇王达
  • 1篇安述倩
  • 1篇李文明
  • 1篇张帅
  • 1篇张轮凯
  • 1篇朱亚涛
  • 1篇刘志勇
  • 1篇张洋
  • 1篇王栋
  • 1篇范涛
  • 1篇宋爽

传媒

  • 2篇计算机工程与...
  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机应用与...

年份

  • 1篇2016
  • 1篇2014
  • 3篇2013
5 条 记 录,以下是 1-5
排序方式:
众核处理器片上网络的层次化全局自适应路由机制被引量:2
2016年
Mesh和环拓扑结构以其实现简单、易于扩展的特点成为众核处理器片上网络应用最为广泛的拓扑结构.应用于Mesh结构中的健忘型路由算法在网络流量较大时影响片上网络的负载均衡,表现在降低吞吐量和增大数据包延迟.自适应算法中的本地自适应算法和区域自适应算法均存在不同程度的短视现象,不适合大规模的Mesh结构,而目前全局自适应算法又由于路由计算量大而速度缓慢.提出一种新的层次化全局自适应路由机制,包括一个全局拥塞信息传播网络Roof-Mesh和一个层次化全局自适应路由算法(global hierarchical adaptive routing algorithm,GHARA).通过全局拥塞信息传播网络得到拥塞信息,GHARA采用全网分区逐级计算路由的方式,减少了全局路由的计算步骤,从而减少了平均数据包延迟、提升了饱和带宽.实验结果表明GHARA表现优于其他区域和全局自适应路由算法.在人工注入通信模式下,8×8 Mesh平均饱和带宽比全局自适应算法GCA提高10.7%,16×16Mesh平均饱和带宽比全局自适应算法GCA提高14.7%.在运行真实测试程序集SPLASH-2模式下,数据包延迟最高比GCA提高40%,平均提升14%.
张洋王达叶笑春朱亚涛范东睿李宏亮谢向辉
关键词:片上网络
SPARC平台模拟器源码级调试系统的研究与实现被引量:2
2013年
软件模拟器采用软件思想模拟真实硬件工作情况,作为嵌入式系统研究的基础研发工具,被广泛应用于体系结构设计调优、软硬件协同设计领域。研究提出一种在SPARC指令集模拟器平台上实现源码级调试系统的方法,一方面该方法使用SPARC交叉调试器对运行于SPARC指令集模拟器上的应用程序进行源码级调试,有效避免了单独实现源码级调试器所带来的调试信息解析困难、可靠性难以验证的弊端;另一方面提出了在集成开发环境下源码级调试系统的高效集成机制,有效解决了进程间切换延时开销大、界面僵死等问题,为SPARC平台嵌入式系统开发人员提供了一种支持图形化界面的高可靠性源码级调试系统。通过具体实现分析,对整个调试系统进行了性能评估。
范涛刘高辉叶笑春李文明宋爽范东睿
关键词:SPARCV8模拟器嵌入式系统
多核结构片上网络性能-能耗分析及优化方法被引量:12
2013年
文中探讨了片上网络在执行真实并行程序时的能耗和性能关系,并提出了一种能耗/性能优化方法.首先,文中提出了一种精确的性能-能耗模型,在性能和能耗模型中同时划分出与频率相关和与频率无关的因素,并分析其对性能和能耗的影响;其次,在性能-能耗模型中建立并行开销、片外访存开销与片上网络规模(节点数)、频率之间的关系,同时引入了并行度、通信模型等与应用相关的因素,使该模型能够同时表达软硬件特性;第三,文中提出了一种基于该性能-能耗模型的性能-能耗优化方法,通过采集程序的通信模型、访存消息数量等数据选择适当的频率和网络节点数来获得片上网络能耗最低值或处理器性能最大值.最后,文中采用8个PARSEC并行程序验证前述模型的准确性并评价性能-能耗优化方法,结果显示文中性能-能耗模型相比传统模型更加精确吻合实验测量结果,性能-能耗优化方法也有效适用于不同种类的并行程序.
张帅宋风龙王栋刘志勇范东睿
关键词:多核片上网络能耗优化
RISC指令集众核处理器功能验证与实现被引量:2
2014年
众核技术已成为当前处理器体系结构发展的必然趋势,如何对众核处理器设计进行有效而充分的验证,成为当今IC设计验证领域的研究热点之一,也是众核处理器芯片能否成功流片的关键因素之一。目前工业界采用基于仿真的验证作为主要的验证方式,重点介绍了以覆盖率为导向的RISC众核处理器的功能验证环境的整体设计,提出了"被动式"的验证思想,并采用"软硬件协同验证"的策略,最终达到每条指令都比对通过的验证目标,辅以后期阶段所引入的时序验证策略和功耗评估策略,完整地提出了一套芯片验证平台搭建和验证功能实现的方法流程。
朱博元刘高辉李政运安述倩
关键词:功耗评估
一种针对片上众核结构共享末级缓存的改进的LFU替换算法被引量:5
2013年
为了得到更高的吞吐率和性能功耗比,众核处理器摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核处理器往往采用共享的末级缓存LLC(Last LevelCache)。因为需要对为数众多相对独立的访问请求作出响应,因此相对于传统多核处理器的末级片内缓存,众核处理器的末级片内缓存更容易产生抖动现象。传统的最久未使用LRU(Least Recent Used)高速缓存替换策略在这种情况下往往无能为力,而几种最新提出的高速缓存替换策略也见效甚微。基于传统的最不经常使用LFU(Least Frequent Used)替换算法,提出一种改进的高速缓存替换算法。相对于LFU替换算法,该算法获取信息的粒度更粗,并且可以掌握更加全局的信息,而这些优势使得该算法更适合作为众核处理器末级片内缓存的替换算法。实验结果表明,在一个64核的众核处理器上,该替换算法可以有效地缓解末级片内缓存的抖动现象,同时该算法实现需要的硬件开销很小。
张轮凯宋风龙王达
共1页<1>
聚类工具0