| 《计算机学报》文章摘要 全文下载 | |
| 文章题目 | 一种基于扩展数据流分析的OpenMP程序应用级检查点机制 |
| 作者 | 富弘毅 丁滟 宋伟 杨学军 |
| 作者单位 | (国防科学技术大学并行与分布处理国家重点实验室 长沙 410073) (国防科学技术大学计算机学院 长沙 410073) |
| 发表年份 | 2010 |
| 发表月份 | 10期(1809—1822) |
| 文章摘要 | 摘要 随着多核处理器体系结构在高性能计算领域日益广泛的应用,面向共享存储并行程序的容错问题成为研究的热点.近年来,检查点技术已经成为该领域占主导地位的容错机制.目前已有一些针对OpenMP程序检查点技术的研究工作,但其中绝大多数解决方案都依赖于特殊的运行时库或硬件平台.该文提出一种编译辅助的OpenMP应用级检查点,它是一种平台无关的方案,通过面向OpenMP的扩展数据流分析选择那些“必需”的变量保存到检查点映像,从而降低容错的开销,同时通过运行一种非阻塞式的协议维护检查点的全局一致性.文章讨论了该机制的各个关键问题,并通过实验评测以及与同类工作的比较,表明了该文所提出的检查点机制在容错性能方面的优势. 关键词 容错;共享存储;OpenMP;应用级检查点;数据流分析 中图法分类号 TP302 DOI号:10.3724/SP.J.1016.2010.01809 |