《计算机学报》文章摘要   全文下载
  文章题目基于FPGA的高精度科学计算加速器研究
  作者雷元武 窦勇 郭松
  作者单位(国防科学技术大学计算机学院 长沙 410073)
  发表年份2012
  发表月份1期(112—122)
  文章摘要摘要 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330 FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QPMAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗. 关键词 四精度浮点算术;LU分解;MGS-QR分解;FPGA;硬件加速器;E量级计算 中图法分类号 TP302 DOI号: 10.3724/SP.J.1016.2012.00112