湖南大学超级计算中心
- 作品数:2 被引量:0H指数:0
- 发文基金:国家自然科学基金湖南省科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于并发性发掘的低开销回卷恢复实现方法
- 回卷恢复容错技术基于时间冗余进行容错,无须结点冗余,是实现高性能计算可靠的主流技术.但现有实现存在同步约束和阻塞问题,其时间开销随系统结点规模增大而剧增.基于依赖的传播特性提出无同步约束的轻量级消息日志协议,基于进程负载...
- YUAN Gong-Biao袁功彪YANG Jin-Min杨金民BAI Shu-Ren白树仁
- 关键词:回卷恢复容错技术
- 文献传递
- 基于并发性发掘的低开销回卷恢复实现方法
- 2013年
- 现有的回卷恢复容错技术存在同步约束和阻塞问题,其时间开销随系统节点规模的增大而剧增。为此,提出一种基于并发性发掘的低开销回卷恢复实现方法。利用消息传递附带跟踪消息依赖的策略解除消息日志中的同步约束,解析进程负载以发掘进程负载的并发性,构建进程负载并发执行的实现架构,采用数据缓存策略和多线程技术实现进程内部各负载的并发执行,以降低故障恢复开销。3个NAS NPB2.3标准性能检测程序的实验结果表明,该方法可使检查点开销从0.63 s、3.19 s、1.21 s分别降低到0.18 s、0.67 s、0.19 s,日志开销率从13.4%、3.5%、18.3%分别降低到0.7%、0.1%、1.0%。
- 袁功彪杨金民白树仁
- 关键词:回卷恢复时间开销消息日志检查点