章隆兵
- 作品数:72 被引量:163H指数:7
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信理学更多>>
- 一种基于RAM的降低异构多核切换开销的方法
- 同一程序的不同执行阶段或者不同程序运行时行为特征不同.异构多核处理器包含多种类型处理器核,可以根据程序运行时的行为特征切换到性能、功耗合适的核.异构多核相对于同构多核处理器能够更好地满足性能和功耗要求,但是不同核间切换时...
- 刘奇郝守青沈海华章隆兵
- 关键词:寄存器重命名
- 文献传递
- 软件DSM系统的重放被引量:2
- 2003年
- 软件 DSM系统的并行调试环境已经成为制约其广泛应用的一个重要因素 .重放方法使得用户能用循环调试技术来调试具有执行不确定性的软件 DSM程序 .本文定义了软件 DSM程序执行的 happen- before- 1关系 ,并依据其提出一种在软件 DSM系统 JIAJIA上实现重放的方法 .实际应用测试表明 。
- 章隆兵张福新陈意云
- 关键词:软件DSM系统软件测试分布式共享存储系统数据竞争日志文件
- 片上多核处理器加速'树类应用'的研究
- 本文提出新的辅助预取线程生成策略,有效地挖掘这类数据结构本身蕴含的访存并行性。进一步,探讨了在片上多核处理器上实现上述辅助预取线程机制所需的软硬件基础设施。实验数据表明,该机制能够有效地缓解处理器的访存瓶颈,进而达到在片...
- 侯锐黄琨高翔章隆兵
- 关键词:片上多核处理器
- 文献传递
- 基于Cache锁和直接缓存访问的网络处理优化方法被引量:2
- 2014年
- 通过分析计算机系统网络数据处理相关程序的访存行为、局部性特点和系统交互等问题,指出在高速网络环境下传统处理器网络子系统设计存在很大缺陷,并进一步提出一种基于软硬件协同设计的优化方案.该方案具体包括改进的直接缓存访问技术、关键程序的cache锁策略和相应系统互连结构及一致性协议等.实验表明,与传统方案相比,基于该方案的网络TCP传输带宽提高约48%,极限情况下UDP丢包率下降40%,传输延时降低超过10%.网络测试程序在与SPEC2000测试程序并发执行情况下,网络数据带宽提高约44%.此外还讨论了该优化方案与其他网络优化技术共同使用的基本原则和相应策略.
- 苏文章隆兵高翔苏孟豪
- 关键词:网络处理系统互联I
- 基于插桩分析的Java虚拟机自适应预取优化框架被引量:3
- 2008年
- 对堆上数据的频繁访问是Java程序的主要开销,为此,研究者们通过虚拟机收集堆上数据访问的信息,而后采用预取或垃圾收集来改进内存性能.常用的收集方法有采样法和插桩法,但二者无法同时满足细粒度和低开销的要求.针对这两个要求,提出基于插桩分析的虚拟机自适应预取框架,该框架通过插桩收集信息,并根据程序运行时的反馈自适应地调整插桩并进行预取优化.实验结果表明,自适应预取优化在Pentium 4上对SPEC JVM98和Dacapo有不同程度的提高,最高的达到了18.1%,而开销控制在4.0%以内.
- 邹琼伍鸣胡伟武章隆兵
- 关键词:插桩自适应
- 片上多处理器中的Cache压缩和接口压缩
- 2008年
- 提出一种简单的基于频繁值和频繁模式的压缩方法,给出结合Cache压缩技术和接口压缩技术的片上多处理器结构。全系统的模拟结果表明Cache压缩技术和接口压缩技术能提高片上多处理器中Cache的有效容量和pin的有效带宽,从而提高系统的性能。实验表明只采用Cache压缩技术平均能提高10%的性能,只采用接口压缩技术平均能提高5.5%的性能,同时采用Cache压缩技术和接口压缩技术平均能提高12%的性能。
- 肖俊华冯子军章隆兵
- 关键词:片上多处理器
- 系统虚拟化中指令去特权化的软硬件协同设计
- 2012年
- 提出了一种软硬件协同设计的去特权化方式,用来减少系统虚拟机中特权指令和敏感指令产生的额外开销。其主要思想是使用修改操作系统源代码的软件去特权化方式减少敏感指令的额外开销,使用修改硬件方式减少非敏感指令的特权指令的额外开销。两者配合使用可最大限度减少虚拟机中这两类指令的额外开销,从而能提高系统虚拟机性能。在MIPS架构CPU的测试板上的实验显示,使用这种方法之后虚拟机的特权指令和敏感指令造成的异常数减少了近97%,同时SPECCINT2000测试集中大部分程序性能提升100%以上。
- 台运方蔡万伟刘奇张戈章隆兵
- 关键词:虚拟化软硬件协同设计
- 基于可行序的数据竞争检测
- 2014年
- 为了在并行程序的单次执行中找到更多的数据竞争,提出了用可行序关系替代传统的"happens-before"序关系来动态地实现数据竞争预测的算法。该算法认为:从技术上讲,如果在观测到的执行轨迹中,两个临界区之间没有可行序的关系,那么这两个临界区的顺序可以被颠倒以构造出其他的执行轨迹;通过判断可行序关系来分析这些构造出来的执行轨迹,就可以找到单次执行中未暴露出来的可能的数据竞争;所有构造出来的执行轨迹中的数据竞争,可以在O(an)的时间内全部检测出来,其中n为程序中所有访存操作的个数,a为每个共享地址上的最大锁集合数。在Java Grande测试程序集上的实验结果说明,上述算法可以找到其他动态检测数据竞争的方法找不到的数据竞争,而且算法时间也完全符合理论上的O(an)时间复杂度。
- 李磊陈云霁章隆兵肖俊华
- 关键词:数据竞争
- 基于无裁剪图形流水线的三维图形处理器
- 2024年
- 传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2.0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采用高效的无裁剪图形流水线结构,消除了裁剪所带来的硬件开销和性能损耗。此外,本文为该图形处理器设计了一个符合IEEE-754标准的三维向量内积(DP3)计算单元,用于固定功能流水线,以提高图形处理器的性能,并消除图形渲染过程中浮点乘加操作的误差,增强了图形处理器的图形渲染鲁棒性。该三维图形处理器每秒能够处理500 M个顶点和8 G个纹素,功耗为1000 mW,采用了28 nm工艺,面积为7.92 mm^(2)。实现结果表明,与之前的工作相比,本文设计的图形处理器的性能-功耗比提高了27.8%。
- 赵皓宇王重熙宋鹏皓章隆兵
- 关键词:裁剪向量内积
- 软件分布式共享存储系统的编程支持环境研究
- 软件分布式共享存储系统(软件DSM系统)结合了共享存储系统的可编程性和消息传递系统的硬件简单性,它在基于消息传递的MPP和机群系统中,用软件的方法把分布于各结点的多个独立编址的存储器组织成一个统一编址的共享存储空间.其优...
- 章隆兵
- 关键词:共享存储系统存储一致性模型数据竞争
- 文献传递