| 《计算机学报》文章摘要 全文下载 | |
| 文章题目 | 基于FPGA的高精度科学计算加速器研究 |
| 作者 | 雷元武 窦勇 郭松 |
| 作者单位 | (国防科学技术大学计算机学院 长沙 410073) |
| 发表年份 | 2012 |
| 发表月份 | 1期(112—122) |
| 文章摘要 | 摘要 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330 FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QPMAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗. 关键词 四精度浮点算术;LU分解;MGS-QR分解;FPGA;硬件加速器;E量级计算 中图法分类号 TP302 DOI号: 10.3724/SP.J.1016.2012.00112 |