国家自然科学基金(61173001) 作品数:7 被引量:19 H指数:2 相关作者: 汪文祥 胡伟武 吴瑞阳 张锋 沈海华 更多>> 相关机构: 中国科学院大学 中国科学院 龙芯中科技术有限公司 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家科技重大专项 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
A low-power high-swing voltage-mode transmitter 被引量:2 2012年 A low-power voltage-mode-logic (VML) transmitter fabricated in TSMC 28 nm CMOS technology is presented. The VML driver outputs a high-swing signal and consumes less power than a current-mode-logic (CML) driver. To further reduce power, the driver is divided into two voltage domains by level shifters. Moreover, the proposed driver topology can achieve mutually decoupled impedance self-calibration and equalization control. The measurement result shows that the transmitter merely dissipates 23 roW/channel while exhibiting an 880 mV differential eye height at 4.488 Gb/s. 陈帅 李昊 石小兵 杨丽琼 杨宗仁 钟石强 黄令仪关键词:EQUALIZATION 基于静态特征的硬件木马检测 被引量:1 2017年 分析了集成电路全球化设计、制造致使集成电路易被植入硬件木马(HT)从而使其存在遭受恶意攻击隐患的硬件安全形势,以及现有硬件木马检测方法的技术特点,在此基础上提出了一种基于静态特征的硬件木马检测新方法——HTChecker。HTChecker基于硬件木马的静态特征利用子图同构技术来检测木马。与其他的检测方法相比,它可以快速精确地找出已知特征的硬件木马。为了不受限于机器内存的大小,该方法借助图数据库来存储电路,这样它对超大规模的电路也可以进行检测。使用ISCAS’89和OpenCores benchmark电路对HTChecker进行了评估,木马电路被随机地插入到这些电路中。实验结果显示HTChecker可以快速精确地找出木马,并且不需要"Golden Chip"的辅助。HTChecker可以有效地处理实际的VLSI设计。 赵跃辉 沈海华关键词:硬件安全 木马检测 子图同构 一种基于RRAM热串扰的奇偶重排编码算法 被引量:1 2018年 阻变存储器(resistive random access memory,RRAM)作为未来一种高性能的非挥发性存储器,具有面积小、操作电压低、兼容性好等特点.但是,在高集成存储器和频繁的写操作下,热串扰问题会严重影响RRAM的保持特性.严重情况下,热串扰问题甚至会造成一系列的错误翻转.因此,本文引入了一种高效的奇偶重排编码算法(parity rearrangement coding scheme,PRCoder)来有效缓解热串扰对RRAM的影响,并在算法层和电路层上分别进行设计与仿真.试验结果表明,PRCoder算法平均降低了32.7%的误翻转率,并同时只会在每一个存储行带来1bit的额外开销.此外,PRCoder仅仅带来0.3%的性能增加和0.008%的面积增加. 李云 张锋关键词:RRAM 用于多核同步优化的cache一致性协议设计 2013年 通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。 陈李维 张广飞 张广飞 汪文祥 王焕东关键词:CACHE一致性协议 基于NUMA架构的解释器访存优化设计与实现 2015年 为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案虚拟机启动时首先获取NUMA节点信息,并在每个NUMA节点中自动生成解释器所需的全部数据结构;解释器在运行时,通过静态或动态的指令分派技术来实现其执行线程在NUMA节点上访存的局部化。试验结果表明,上述方法能够显著提升解释器在NUMA系统中的性能。在DaCapo测试集上的总体性能提升了8%,最高性能提升幅度高达23%,而且算法实现代价低,适用于绝大多数的NUMA服务器系统。 任彤 傅杰 靳国杰关键词:虚拟机 解释器 响应速度 启动性能 片上多核处理器的区域共享的双粒度目录 2015年 研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。 曾露 陈新科 王焕东关键词:片上多核处理器 缓存一致性 区域共享 龙芯GS464E处理器核架构设计 被引量:15 2015年 龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cache容量和TLB容量.访存子系统拥有3级Cache结构,每一级都采用LRU替换策略,可以支持多核缓存一致性协议.经过上述强化设计,GS464E处理器核已成为一个创新性的高性能处理器核架构. 吴瑞阳 汪文祥 王焕东 胡伟武关键词:多核处理器 缓存一致性