钟祺
- 作品数:5 被引量:5H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家科技重大专项国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于数据对象规模的Rank级内存分配方法被引量:1
- 2014年
- 利用主存的多bank/rank/channel结构挖掘访存并行性和局部性,是提高系统性能的重要手段.相关研究工作通过sub-rank技术增加可并行工作的存储资源,或在并行程序之间对bank划分,以隔离访存冲突.但上述方法没有考虑在bank/rank资源共存的情况下,单个程序内部数据对象间的冲突问题.通过观察数据在主存中的分布,发现程序的数据倾向聚簇于单个rank中,并提出了一种基于数据对象规模的rank级内存分配方法(data object scale aware rank-level memory allocation,DSRA).DSRA将冲突开销较大的数据对象分散到不同的rank,利用增长的bank/rank资源提高访存性能.DSRA工作在操作系统层,基于编译器和操作系统提供的信息来分析数据对象间的冲突开销,既不用修改源码,也不依赖特殊的底层硬件.基于2款真实处理器对来自NAS Benchmark和SPEC CPU2000中的存储敏感型基准测试程序进行评测.结果表明,在不影响cache失效率的情况下,DSRA通过减少主存访问周期数,可以降低程序的执行时间.与已有的优化技术相比,性能平均提高6.8%,最高性能提升幅度为16%.
- 钟祺王晶管雪涛黄涛王克义
- 关键词:操作系统内存分配数据对象
- 面向多媒体SoC的存储体访存负载均衡划分方法被引量:1
- 2015年
- 随着多媒体So C中具备密集访存能力的设备数量增加,设备之间频繁争抢存储体资源,严重影响访存性能.为此提出一种面向多媒体So C的存储体访存负载均衡划分方法.通过操作系统对物理内存的管理,将设备所访问的数据映射到独立的存储体中,避免争抢频繁的设备共享存储体,减少设备间的访存冲突;划分过程基于数据量、延迟分析设备访存行为与访存冲突之间的关系,并以此来均衡各存储体的访问负载,同时提升多个设备的访存性能.该方法不依赖特殊硬件也无需修改上层应用,提供了一种透明的纯软件优化手段.将文中方法应用于真实的多媒体So C的实验结果表明,与基于带宽优先的划分方法相比,该方法在提高带宽利用率的同时降低访存延迟,将解码帧率提升8.4%~12.3%;并且在保证服务质量的情况下,可以通过进一步降低内存工作频率来减少系统功耗.
- 钟祺王晶王克义
- 关键词:内存分配
- 面向存储层次访问优化的内存分配策略研究
- 受功耗、线延迟、芯片引脚封装成本的限制,通过大幅增加存储资源来提高系统访存性能的方式,日益受到严重挑战。但随着应用种类的丰富以及工作集规模的扩大,大量数据被映射到相同的存储结构,即有限的存储资源所承载的数据访问量不断增加...
- 钟祺
- 关键词:操作系统
- 采用分区域管理的软硬件协作高能效末级高速缓存设计被引量:2
- 2013年
- 受"存储墙"和"功耗墙"影响,末级高速缓存污染会造成严重的性能损失和能耗开销.针对单纯基于硬件或软件的传统优化方法无法有效地识别局部性差的数据,且存在一定的优化空间的问题,提出一种软硬件协作的末级高速缓存设计方法.该方法在运行时刻剖视分析程序内不同数据区域的访存行为,并通过相应接口动态地调整每个数据区域的旁路和插入策略,可以在提高处理器访存性能的同时降低其能耗,提高系统的能效性.实验结果表明,与现有的LRU,DIP和DRRIP方法相比,采用文中方法后处理器平均能效性分别提升了17.42%,12.79%和8.15%.
- 黄涛王晶管雪涛钟祺王克义
- 一种降低末级高速缓存污染的软件控制插入策略被引量:1
- 2012年
- 现有高速缓存替换算法大多无法有效识别数据的局部性特征,导致高速缓存内即将被访问到的数据可能被未来不会被访问到的数据所替换,造成高速缓存污染问题.末级高速缓存污染引发的性能损失随着处理器和存储器之间性能差距的扩大而不断增大,成为制约系统性能提升的重要瓶颈之一.本文针对末级高速缓存污染问题,在剖视分析访存密集型程序的页一级访存行为基础上,提出一种软件控制末级高速缓存插入策略.本方法通过控制和指导页一级数据插入位置,限制局部性差的数据页在末级高速缓存中的访问空间,达到降低末级高速缓存污染的目的.实验结果表明,相对于LRU和DIP策略,本文方法能够有效降低末级高速缓存失效率,提高程序性能.
- 黄涛王晶管雪涛钟祺王克义