FPGAGPUCPU在高性能计算的应用及展望综述
FPGA,GPU和CPU在高性能计算领域的应用及展望
课 程:系统及可编程芯片设计
专 业:微电子学与固体电子学
姓 名:
学 号:
任课老师: FPGA,GPU和CPU在高性能计算领域的应用及展望
目前FPGA对于浮点数的运算速度已经达到1TFLOP(每秒万亿次浮点运算),同时GPU和多核CPU通过利用最新的IC设计技术也大大提高了其运算能力。本文将对比三种结构对于高性能计算的发展趋势,同时也会介绍在特定运算环境下三种结构的持续性能。
高性能计算中FPGA,GPU和CPU的简介
近年来,传统用于图像处理的GPU逐渐被发掘用来进行高性能计算,并且达到了相当好的效果,在单精度浮点运算中的速度达到5TFLOPs,在双精度浮点运算中的速度可以达到1TFLOPs。如今性能最好的GPU处理器(比如NVidea的Tesla K20和K40)与一些其他的多核处理器(比如Intel Xeon Phi处理器以及IBM和Inter的一些处理器)相比表现出了非常好的计算性能。
FPGA传统上是应用于单精度的定点运算,不过现在也可以浮点数进行高性能的计算,单精度浮点数的运算峰值已经超过1TFLOPs。但是运算的峰值并不能代表在特定环境下器件的持续工作性能,比如在计算2级的FFT时,Inter的80-teraflop持续工作性能只能达到其峰值性能的2.73%(20GFLOPs)。FPGA工作在一个较低的频率下,运算峰值较低,但是可以通过硬件优化来实现对特定应用的更好的运行效率,即持续性能能达到更接近峰值运算性能的值,同时与GPU和CPU相比FPGA的功率效率更高。
一个特定的应用在不同的平台上运算是不一样的,对于运算结果的评估可以基于以下几点:性能、功耗、功率效率、运行效率、成本以及其他。在本文中,我们分析每个期间在峰值性能以及能耗方面的发展趋势,并对三者在一些科学应用的持续性能进行对比,找出对于某一特定应用的最佳运算平台。
峰值计算性能发展趋势
GPU
GPU最初被设计用来进行图像处理并在该方面显示出了强大的优势,近10年来GPU逐渐被应用到通用计算领域,一般称为GPGPU。基于其强大的并行计算能力,在一些其他的计算分析方面其性能早已可与多核CPU相媲美。
观察多代GPU的发展,我们发现其峰值性能并不是简单的线性增长,单精度浮点运算和双精度浮点运算都是这样。我们没有办法去简单的描述GPU的全面的发展,因为各种GPU的结构非常多,所以在此只挑出在某个年份的最佳性能的一些GPU进行分析。结果如图1所示[1]。
图1 GPU的峰值性能
观察图1可知,每一代GPU之间的性能提升超过1TFLOP,同时右图中可知在某些年份工艺技术没有提升,但是性能提升了,说明性能的增长不仅与新的制造工艺有关也与结构的优化有关。单精度和双精度的性能差距由最初的相差10倍降到了最新一代的只差4倍左右。
关于能耗方面,GPU的功率效率(峰值性能与热设计功耗(TDP)的比值)也是在稳定则增长,单精度的功率效率由最初的0.5GFLOPs/W增加到了GFLOPs/W,双精度的功率效率由0.5GFLOPs/W增加到了6GFLOPs/W。这意味着GPU以一个增长的功率效率提供着一个惊人的运算性能。
GPU的外部存储带宽也非常高,Geforce 6800的带宽为35 GBytes/s,K20, K20X 和 K40的带宽分别为208,250和288 GBytes/s。.
多核CPU
通用CPU的峰值运算性能在近年来也获得了显著提升,图2中显示了部分Intel的著名CPU的峰值运算性能。
Intel最近推出的Xeon PHI 7120P处理器的峰值运算性能可以达到单精度2416GFLOPs,双精度1208GFLOPs,Intel处理器计算性能的提升靠的是增加CPU的核数,这些处理器的功率效率和GPU相比较低。最初65nm技术的CPU的功率效率为0.1 GFLOPs/W,目前22nm技术下的CPU的功率效率已经增加到单精度9 GFLOPs/W,双精度4.5 GFLOPs/W。
在Intel的这些处理器中,2008年出的一款多核处理器在3.16GHz频率1.07V电压下,峰值运算速度可以达到单精度1 TFLOP。CPU或者多核CPU的存储器带宽也很高。比如Xeon PHI 7120P的带宽为352GBytes/s,比最近出的GPU稍微高一些。
图2 CPU的峰值性能
FPGA
FPGA的峰值运算性能由它所包含的乘法器和LUT的资源决定,观察Xilinx公司的一些产品发现乘法器和LUT的资源并不是线性增长的(如图3所示)。最新的Virtex7系列FPGA中 XC7VX980T含有3600个18*18的乘法器和612000个LUT,XC7V20
您可能关注的文档
- 发蒸馏法回收轧钢油泥中废油及氧化铁粉的研究讲义.doc
- 反比例的意义讲义.ppt
- FMEA2综述.ppt
- 反比例函数的图象和性质第二课时讲义.ppt
- 反比例函数图案讲义.doc
- Flex从入门到实践综述.ppt
- FN-09-02有色金属采矿、选矿行业能源管理体系认证实施规则(魏宗平)综述.doc
- ForWantofaDrink综述.ppt
- FOB,CFR,CIF与FCA,CPT,CIP的区别综述.ppt
- FOXBORO__IA_高级培训综述.ppt
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- 2026年妇幼健康信息化建设工作计划.docx VIP
- TSG 11-2020锅炉安全技术规程.docx VIP
- 《AIGC应用实战:写作、绘图、视频制作、直播》-课件全套 王翎子 第1--9章 认识AIGC ---即创的使用方法.pptx VIP
- 隧道施工及质量控制培训课件.ppt VIP
- 江苏省无锡市近三年数学中考考前考点分析及易错点巩固.docx VIP
- 公司职位说明书与绩效考核范本全套体系.doc VIP
- 建筑公司项目部及公司各岗位绩效考核表.pdf VIP
- 窗帘采购安装项目 投标方案(技术方案).docx
- JCT 2459-2018 陶粒泡沫混凝土.pdf VIP
- 配电室安全操作规程及管理规范.docx VIP
原创力文档

文档评论(0)