李祖松
- 作品数:24 被引量:74H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于约束的处理器接口随机测试模型被引量:1
- 2007年
- 提出了一种处理器接口测试模型,并给出了具体实现方案。该测试模型将仿真测试的方法应用于处理器接口测试,在激励生成中采用基于约束的随机测试生成方法。结果表明,基于约束的处理器接口随机测试模型的覆盖率达到83.68%,能够快速有效地完成处理器接口部件的功能验证。
- 郇丹丹李祖松刘志勇
- 关键词:接口仿真龙芯2号
- 一种高速缓存失效的处理器访存指令处理方法
- 本发明公开了一种高速缓存失效的处理器访存指令处理方法,该方法包括:利用全修改Cache块节省访存带宽,通过预测失效的存数指令写高速缓存还是写低层存储系统,充分发挥两种处理方法的优点。本发明减少了失效存数指令造成的存储管理...
- 郇丹丹胡伟武李祖松
- 文献传递
- 同时多微线程体系结构研究被引量:1
- 2007年
- 随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术.提出一种融合同时多线程技术和微线程技术的新型体系结构同时多微线程(simul-taneous multi-microthreading,SMMT),并给出同时多微线程体系结构的实现方案.SMMT有效结合同时多线程技术硬件代价小和微线程技术能够加速单进程应用的优点,通过软硬件协同的方式充分挖掘单进程程序的微线程级并行性.通过在设计的龙芯2号同时多微线程处理器上进行性能评测,结果表明,同时多微线程体系结构能够有效地加速单进程的程序,以很小的硬件代价显著地提高了处理器的性能.
- 李祖松许先超胡伟武唐志敏
- 关键词:同时多线程体系结构
- 龙芯2号处理器多线程技术研究
- 随着集成电路工艺技术的发展,单个芯片上可集成的晶体管数目已达到10亿个,如何利用这些晶体管资源设计高性能处理器成为当前重要的研究课题。多线程技术通过利用晶体管资源,开发线程级并行度来提高系统性能,是未来高性能处理器发展的...
- 李祖松
- 关键词:微体系结构LINUX操作系统线程技术处理器
- 文献传递
- 一种多处理器系统及Cache一致性消息传输方法
- 本发明提供一种多处理器系统及Cache一致性消息传输方法,包括至少两个包含有一级缓存的处理器核,以及至少两个二级缓存,处理器核与二级缓存间通过总线连接;总线包括读地址通道、读数据通道、写地址通道、写数据通道以及写应答通道...
- 郇丹丹陈云霁李祖松高翔胡伟武
- 文献传递
- 龙芯2号处理器设计和性能分析被引量:45
- 2006年
- 介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
- 胡伟武张福新李祖松
- 关键词:超标量流水线乱序执行寄存器重命名性能分析
- 一种利用例外机制维护多线程处理器的存储一致性的方法
- 本发明公开了一种利用例外机制维护多线程处理器的存储一致性的方法,该方法包括:当某一线程的一条取数指令进入访存管理队列时,查找其它线程的访存管理队列中是否有地址相关的存数指令,如果有则把该线程的取数指令置例外重新执行;当某...
- 李祖松胡伟武郇丹丹
- 文献传递
- Cache自适应写分配策略被引量:4
- 2007年
- 处理器所能提供的有效带宽是目前制约处理器性能提高的关键因素.通过对Cache写失效行为的分析,提出了一种新的提高处理器带宽利用率的Cache写失效处理策略——Cache自适应写分配策略.该策略在访存失效队列中收集全修改Cache块,对全修改Cache块采用非写分配策略,并能够自适应地切换为写分配策略.与传统的Cache写失效处理策略相比,Cache自适应写分配策略硬件代价小,避免了不必要的数据传输,降低Cache污染,减少存储管理队列阻塞的频率.结果表明,采用Cache自适应写分配策略,STREAM基准测试程序带宽平均提高62.6%,SPECCPU2000程序的IPC值平均提高5.9%.
- 郇丹丹李祖松胡伟武刘志勇
- 关键词:CACHE带宽龙芯2号
- 一种多处理器系统及Cache一致性消息传输方法
- 本发明提供一种符合AXI协议的多处理器系统,包括至少两个包含有一级缓存的处理器核,以及至少两个二级缓存,处理器核与二级缓存间通过总线连接;总线包括读地址通道、读数据通道、写地址通道、写数据通道以及写应答通道;通道中的线路...
- 郇丹丹陈云霁李祖松高翔胡伟武
- 文献传递
- 快速地址计算的自适应栈高速缓存被引量:1
- 2007年
- 随着存储系统的访问速度与处理器运算速度的差距越来越显著,访存性能已成为提高处理器性能的瓶颈.通过对程序的访存行为进行分析,提出快速地址计算的自适应栈高速缓存方案.该方案将栈访问从数据高速缓存的访问中分离出来,充分利用栈空间数据访问的特点,提高指令级并行度,减少数据高速缓存污染,降低数据高速缓存失效率,并采用快速地址计算策略,减少栈访问的命中时间.该栈高速缓存在发生栈溢出时能够自适应地关闭,以避免栈切换对处理器性能的影响.栈高速缓存标志中增加进程标识,进程切换时不需要将数据写到低层存储系统中,适用于多进程环境.SPEC CPU2000程序运行结果表明,采用快速地址计算的自适应栈高速缓存方案,25.8%的访存指令可以并行执行,数据高速缓存失效率平均降低9.4%,IPC值平均提高6.9%.
- 郇丹丹李祖松王剑章隆兵胡伟武刘志勇
- 关键词:高速缓存自适应龙芯2号