《计算机学报》文章摘要   全文下载
  文章题目曙光5000高性能计算机Barrier网络的设计
  作者曹政1),2),3) 王达伟1),2),3) 刘新春1),2) 孙凝晖1),2)
  作者单位1)(中国科学院计算技术研究所 北京 100190) 2)(中国科学院计算机系统结构重点实验室 北京 100190) 3)(中国科学院研究生院 北京 100039)
  发表年份2008
  发表月份10期(1727—1736)
  文章摘要摘要 为优化Barrier操作的性能,提高大规模并行计算应用在曙光5000系统中的执行效率,文中提出了一种基于硬件的Barrier加速设计.该设计是采用树形Barrier算法,通过增强曙光5000互联网络交换芯片的功能,实现低延迟、可扩展、高可靠和可管理的Barrier网络.该网络支持并发16个Barrier操作,可在 Fat-Tree拓扑环境下实现较低的Barrier操作延迟.相比已有实现,是更适合Fat-Tree拓扑的设计方案.理想情况下,1024个节点的同步操作在1.7μs内完成.根据Barrier操作归约和分发过程的特点,分别采用请求应答和超时催促两种机制,为Barrier操作的可靠性提供保障.以该设计实现的Barrier网络原型系统已通过FPGA验证. 关键词 高性能计算机;多级互联网络;胖树;Barrier;同步;归约;分发;可靠