从Fermi架构看GPU发展.docVIP

下载本文档

12
0
约1.81万字
约 26页
2017-08-28 发布于安徽
举报
版权申诉

从Fermi架构看GPU发展.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载！

AMD向左NVIDIA向右？从Fermi架构看GPU发展作者:　发布时间:2009-12-31 09:39:54　来源:驱动之家字号:大中小关闭本页 [1.导读] 就像所有的故事都会以“从前有个……”开头那样，我们今天的故事也会有这样无聊的开始。这一次要讲述的是两个显卡大腕，一个是NVIDIA，另一个则是AMD的图形部门。自从3D显卡问世以来，他们一直是竞争关系，以前是，现在也是，但是以后呢?在有关显卡的未来走向上，许多人都可以从近两年来的表现中觉察到NVIDIA已经不跟AMD拴在一个绳上了，AMD在DX11时代抢先出手，背靠微软好乘凉，继续坚持DX游戏之路，支持DX11的HD 5000显卡目前也是蝎子尾巴―独一份。NVIDIA即便没有抢得下一代显卡的沙发，但是雄心不已，他们自信比AMD看得更远，也会做得更好，新一代Fermi架构的显卡将成为NVIDIA最大的王牌。双方的分歧似乎早有预见。DX9以及之前的时代，衡量显卡性能最重要的两个指标就是顶点单元（Vertex shader）和像素单元（pixel shader）的运算能力，通常VS和PS单元更多的显卡性能也越强。在DX10规范中，微软将VS和PS（还有一个Geometry shader几何渲染器，GS）的功能合并，统一为Unified shader，也称为Stream proceser（流处理器），这个架构一直延续到现在，即使是DX11也是以流处理器为运算核心的。统一渲染单元的好处是显而易见的，设计人员不需要再考虑顶点、像素以及几何运算的不同，不仅编程难度大大下降，而且程序的通用性也逐渐显露出来，由此开始AMD和NVIDA在显卡的核心架构设计乃至发展方向上都产生了分歧。早在2003年的时候NVIDIA就已经在谋划GPU通用计算，由于没有统一的标准相关厂商都是摸着石头过河。当时的思路就是通过OpenGL以及DX中的高级着色器语言（High-level Shading Language）将程序映射为GPU可以识别的图形运算，计算完成后再进行一次映射而得到人们需要的结果。说白了这样的做法是在“蒙骗”GPU，需要小心翼翼地处理，不然GPU就会翻脸不干。 NVIDIA当时推出过一种CG（C For Graphic）语言来调用GPU资源进行编程开发。CG基于C语言，但是并不完全相同，程序员还是需要花时间来学习CG语言才能顺利使用。AMD（当时还是ATI）也研究过GPU通用计算，早在X1900时代就和Folding@Home项目合作利用自家Stream通用计算技术提供计算支持，限于当时的技术这些尝试并未取得多少成功。 DX10中统一渲染器的出现推动了GPU通用计算的发展 GPU通用计算在DX10时代有了新的机会，因为DX10中微软用统一渲染器（Unfied Shader）取代了像素渲染器、顶点渲染器以及几何渲染器的功能，计算指令不再有顶点、像素或者几何之分，处理过程得以简化。微软并未强制规定统一渲染器如何设计，AMD和NVIDIA也因此各自设计了适合自己的统一渲染器，AMD推出的是原有设计的改良版，NVIDIA则以此为契机设计了更加通用的统一渲染器，从G80架构开始走上GPU通用计算的“康庄大道”，GT200发布时更是喊出“GPU中心论”，而最新的Fermi架构完全为高性能计算而生。本文历数AMD与NVIDIA最近几代的GPU架构设计，并重点探讨了Fermi架构的设计，或许我们能从中理解两家厂商的不同理念以及他们对未来的发展设想。 [2.NVIDIA与AMD统一渲染架构的不同] 计算机每个像素都是由RGB（红绿蓝三原色）组成，并附加alpha灰度值表示各颜色的透明度，顶点则包含XYZW四个坐标。因此在进行图像处理时像素单元可以同时进行R、G、B以及Aplha四次运算得出像素的颜色，顶点单元也可以一次进行XYZW四次矢量坐标运算，DX10之前的架构都是这种SIMD（Single Instruction Multiple Data，单指令多数据）架构，这种架构在进行4D矢量运算时效率最高，可以100%满负载执行而不浪费运算单元。除了矢量运算，游戏中的标量运算也越来越多，执行1D标量计算时传统SIMD架构的利用率就只有原来的25%，这将带来不可避免的效能降低。AMD之前也采取过变通手法，将4D矢量改为3D矢量+1D标量运算，NVIDIA的G70中除了3D+1D组合之外还有2D矢量+2D标量的运算方式。随着DX10中统一渲染单元的到来，SIMD架构的缺陷日益显现，厂商需要新的架构设计。 AMD将传统的4D矢量运算改良为4D+1D架构 AMD的解决方法是将原有的4D矢量运算拓展到4D矢量+1D标量架构，并命名为Supersclar（超标量），而4D+1D的运算架构也一直使用