FPGA GPU CPU 在高性能计算的应用及展望总结.docx

下载文档

0
0
约5.8千字
约 9页
2024-04-02 发布于上海
举报
版权申诉
保障服务

FPGA GPU CPU 在高性能计算的应用及展望总结.docx

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

FPGA,GPU和CPU在高性能计算领域的应用及展望

课程：系统及可编程芯片设计专业：微电子学与固体电子学姓名：

学号：任课老师：

系统及可编程芯片设计

FPGA,GPU 和CPU在高性能计算领域的应用及展望

目前FPGA对于浮点数的运算速度已经达到1TFLOP（每秒万亿次浮点运算），同时GPU和多核CPU通过利用最新的IC设计技术也大大提高了其运算能力。本文将对比三种结构对于高性能计算的发展趋势，同时也会介绍在特定运算环境下三种结构的持续性能。

高性能计算中FPGA,GPU 和CPU 的简介

近年来，传统用于图像处理的GPU逐渐被发掘用来进行高性能计算，并且达到了相当好的效果，在单精度浮点运算中的速度达到5TFLOPs，在双精度浮点运算中的速度可以达到1TFLOPs。如今性能最好的GPU处理器（比如NVidea的TeslaK20和K40）与一些其他的多核处理器（比如IntelXeonPh处i理器以及IBM和Inter的一些处理器）相比表现出了非常好的计算性能。

FPGA 传统上是应用于单精度的定点运算，不过现在也可以浮点数进行高性能的计算，单精度浮点数的运算峰值已经超过1TFLOPs。但是运算的峰值并不能代表在特定环境下器件的持续工作性能，比如在计算2级的FFT时，Inter的80-teraflo持p续工作性能只能达到其峰值性能的2.73%（20GFLOPs）。FPGA 工作在一个较低的频率下，运算峰值较低，但是可以通过硬件优化来实现对特定应用的更好的运行效率，即持续性能能达到更接近峰值运算性能的值，同时与GPU和CPU相比FPGA 的功率效率更高。

一个特定的应用在不同的平台上运算是不一样的，对于运算结果的评估可以基于以下几点：性能、功耗、功率效率、运行效率、成本以及其他。在本文中，我们分析每个期间在峰值性能以及能耗方面的发展趋势，并对三者在一些科学应用的持续性能进行对比，找出对于某一特定应用的最佳运算平台。

峰值计算性能发展趋势

GPU

GPU最初被设计用来进行图像处理并在该方面显示出了强大的优势，近10年来GPU逐渐被应用到通用计算领域，一般称为GPGPU。基于其强大的并行计算能力，在一些其他的计算分析方面其性能早已可与多核CPU相媲美。

观察多代GPU的发展，我们发现其峰值性能并不是简单的线性增长，单精度浮点运算和双精度浮点运算都是这样。我们没有办法去简单的描述GPU的全面的发展，因为各种GPU的结构非常多，所以在此只挑出在某个年份的最佳性

能的一些GPU进行分析。结果如图1所示[1。]

图1GPU的峰值性能

观察图1可知，每一代GPU之间的性能提升超过1TFLOP，同时右图中可知在某些年份工艺技术没有提升，但是性能提升了，说明性能的增长不仅与新的制造工艺有关也与结构的优化有关。单精度和双精度的性能差距由最初的相差10

倍降到了最新一代的只差4倍左右。

关于能耗方面，GPU的功率效率（峰值性能与热设计功耗（TDP）的比值）也是在稳定则增长，单精度的功率效率由最初的 0.5GFLOPs/W 增加到了GFLOPs/W ，双精度的功率效率由0.5GFLOPs/W 增加到了6GFLOPs/W 。这意味着GPU以一个增长的功率效率提供着一个惊人的运算性能。

GPU的外部存储带宽也非常高，Geforce680的0

带宽为35GBytes/，s

K20，

K20X 和K40的带宽分别为208，250和288GBytes/。s.

多核CPU

通用CPU的峰值运算性能在近年来也获得了显著提升，图2中显示了部分Intel的著名CPU的峰值运算性能。

Intel最近推出的XeonPHI7120P处理器的峰值运算性能可以达到单精度2416GFLOPs，双精度1208GFLOPs，Intel处理器计算性能的提升靠的是增加CPU的核数，这些处理器的功率效率和GPU相比较低。最初65nm技术的CPU的功率效率为0.1GFLOPs/W，目前22nm技术下的CPU的功率效率已经增加到单精度9GFLOPs/W，双精度4.5GFLOPs/W。

在Intel的这些处理器中，2008年出的一款多核处理器在3.16GHz频率1.07V电压下，峰值运算速度可以达到单精度1TFLOP。CPU或者多核CPU的存储器带宽也很高。比如XeonPHI7120P的带宽为352GBytes/s，比最近出的GPU稍

微高一些。

图2CPU的

您可能关注的文档

文档评论（0）

dqy118 + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体上海海滋实业有限公司

IP属地上海

统一社会信用代码/组织机构代码: 91310115MA7DL1JF2N

1亿VIP精品文档

更多 >

FPGA GPU CPU 在高性能计算的应用及展望总结.docx