《计算机学报》文章摘要   全文下载
  文章题目ORC的全局指令调度技术
  作者杨书鑫 张兆庆
  作者单位(中国科学院计算技术研究所 北京 100080)
  发表年份2004
  发表月份5期(577-586)
  文章摘要摘要 IA-64是一种崭新的体系结构,它为挖掘程序中潜在的指令级并行提供了丰富的硬件支持,例如:大寄存器组、(控制/数据)投机、谓词等.Itanium是IA-64的一个具体实现.该文作者将Bernstein的基于超标量处理机的全局指令调度算法应用于显式并行(EPIC)的Itanium处理机上.在结合Itanium处理机特性的同时,作者对Bernstein的算法有以下两点创新:(1)应用层次化区域.相对于传统的扁平区域,这样的区域具有很强的灵活性并提供了调度器大小合适的调度范围,使其既能充分利用硬件资源又能够有效地控制调度的时间和空间开销.(2)集成P-Ready指令调度.P-Ready是在与Bernstein算法框架差异很大的上下文中提出的.P-Ready指令调度能够把优先级高的指令尽早调度即使这条指令并没有在所有经过它的执行路径上解除数据依赖.集成P-Ready指令调度到Bernstein的算法框架上是十分有意义的.作者在“基于Itanium处理机的开放源码编译器ORC”中实现了该文介绍的算法,实验结果显示全局指令调度器对CPU2000int基准测试例平均有8.4%的运行时加速比.作为应用层次化区域的优越性的一个反映,调度指令跨越嵌套循环最高可取得12.9%的运行时加速比.此外,P-Ready指令调度对CPU2000int的测试例平均有1.37%的运行时加速比,最高可达7.6%. 关键词 IA-64;Itanium;全局指令调度;层次化区域;P-Ready 中图法分类号 TP302