贾小敏
- 作品数:13 被引量:15H指数:2
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 程序执行的精确重现技术及其在体系结构模拟中的应用
- 2011年
- 近年来有研究提出利用动态二进制翻译技术(Dynamic Binary Translation,DBT)加速程序代表性模拟点的提取,然而这些研究并未考虑DBT方法对模拟结果准确度的影响.实验发现,对于某些程序,DBT加速方法会带来将近20%的误差.经分析,误差的根源在于程序在DBT执行和模拟执行时执行踪迹有巨大差异,即程序执行踪迹的不可重现性.本文系统地分析了引起程序执行踪迹不可重现的原因,提出了解决方法.实验证实,利用文中提出的方法,可以在不影响性能的情况下,实现程序执行踪迹的精确重现,从而保证DBT方法与传统模拟方法具有完全相同的精确度.
- 赵天磊唐遇星徐炜遐付桂涛齐树波贾小敏张民选
- 关键词:模拟误差二进制翻译
- 存储密集流应用感知的多核共享Cache划分机制
- 片上末级Cache (Last Level Cache,LLC)的管理是片上多核(Chip Multi-Processors,CMP)处理器的关键问题.为充分利用Cache资源,大部分研究将LLC组织为共享结构.Cach...
- 贾小敏齐树波谢胡赵天磊张民选
- 关键词:CACHE划分
- 多核处理器片上Cache访问行为分析与优化机制研究
- 多核处理器(Chip Multi-Processors,CMP)相比单核处理器具有功耗低、复杂度小、可扩展性好和性价比高等优势,已成为工业界和学术界的主流微处理器体系结构。近来在服务器和数据中心等领域,服务聚合(Serv...
- 贾小敏
- 关键词:多核处理器
- 文献传递
- 高准确率的应用程序行为分析方法
- 2011年
- 模拟是体系结构研究的重要手段。由于模拟的速度非常慢,有研究提出利用动态二进制翻译技术(DBT)提取程序的代表性模拟点,对代表性模拟点进行详细模拟即可获取程序的准确性能参数,从而缩短模拟时间。然而相关研究并未考虑DBT方法对模拟结果准确度的影响。实验发现,对于某些程序,DBT加速方法会给模拟结果带来近20%的误差。为消除误差,系统分析了引起指令踪迹差异的原因,并提出了一系列消除这些差异的方法。实验结果证实,利用该文提出的方法,可以在不影响DBT方法性能的同时,保证其与传统模拟方法具有完全相同的精确度。
- 赵天磊唐遇星齐树波付桂涛贾小敏张民选
- 关键词:PROFILE二进制翻译模拟误差
- 利用动态二进制翻译加速应用程序行为特征分析被引量:6
- 2012年
- 应用程序运行时典型行为特征分析的一种重要方法是SimPoint,但是为SimPoint生成基本块向量剖析(basic block vector profile,BBV profile)文件非常耗时.首先提出了一个利用动态二进制翻译技术生成BBVprofile的通用框架DBT-BBV,然后详细分析了几种降低开销的优化技术,最后基于DBT-BBV和提出的优化技术设计实现了一个高效的BBVProfile收集工具QPoint.利用SPEC2006测试程序集评估了所提出的优化技术和QPoint的性能和开销.与现有工具相比,QPoint有两个优势:①QPoint的性能高于现有工具,在普通PC机上最高速度为292MIPS,平均速度为109MIPS,BBV Profile收集的平均开销小于4%,在同类工具中最低;②QPoint支持众多体系结构平台,包括x86/x86_64,ARM,POWER,SPARC,MIPS等,并且可跨指令集收集BBVProfile.结果显示,动态二进制翻译技术在应用程序行为特征分析加速方面具有非常好的效果.
- 赵天磊唐遇星付桂涛贾小敏齐树波张民选
- 关键词:二进制翻译PROFILE
- 基于EPIC同时多线程的软件模拟器开发及取指策略研究
- 指令级并行(Instruction Level Parallelism,ILP)的进一步开发变得越来越困难,因此线程级并行(Thread Level Parallelism,TLP)便成为了微体系结构研究者们关注的热点。...
- 贾小敏
- 关键词:显式并行指令计算同时多线程取指策略资源利用率
- 面向片上网络的低延迟路由器结构
- 本发明公开了一种面向片上网络的低延迟路由器结构,目的是解决现有路由器结构转发报片延迟较大和不能够充分的利用物理链路中的存储资源的问题。本发明由P个输入单元,P个输出单元和P个通道双缓冲组成;每个输入单元由一个缓冲分配器,...
- 李晋文齐树波张民选邢座程曹跃胜胡军冯超超赵天磊乐大珩贾小敏陈延仓
- 文献传递
- SoC体系结构处理器关键技术和研发现状
- C设计技术可以充分利用已有的设计积累,显著提高ASIC的设计能力,因此受到了广泛关注.集成电路制造工艺的发展使得芯片集成度越来越高,单芯片晶体管数目越来越多,可以把更多的功能集成到片内,进一步推动了SoC技术的发展.随着...
- 张民选孙彩霞贾小敏齐树波孙岩何小威
- 关键词:SOC
- 面向片上网络的低延迟路由器结构
- 本发明公开了一种面向片上网络的低延迟路由器结构,目的是解决现有路由器结构转发报片延迟较大和不能够充分的利用物理链路中的存储资源的问题。本发明由P个输入单元,P个输出单元和P个通道双缓冲组成;每个输入单元由一个缓冲分配器,...
- 李晋文齐树波张民选邢座程曹跃胜胡军冯超超赵天磊乐大珩贾小敏陈延仓
- 基于EPIC的同时多线程处理器取指策略被引量:1
- 2007年
- EPIC硬件简单,同时多线程易于开发线程级并行,在EPIC上实现同时多线程可以结合二者的优点。取指策略对同时多线程处理器的性能有重要影响。该文介绍了几种有代表性的超标量同时多线程处理器取指策略,分析了这些策略在EPIC同时多线程处理器上的适用性,提出了一种新的适用于EPIC的取指策略SICOUNT。分析表明SICOUNT策略可以充分利用EPIC软硬件协同的优势,在选择取指线程时使用编译器所提供的停顿信息,能更精确地估计各个线程的流动速度,使取出指令的质量更高。
- 贾小敏孙彩霞张民选
- 关键词:显式并行指令计算同时多线程取指策略ITANIUM