AMD与NVIDIAGPU特点及优势.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
AMD与NVIDIAGPU特点及优势

AMD和NVIDIA的GPU特点及优势 发表时间:2011-4-25?作者: 熊东旭?来源: e-works 关键字:? HYPERLINK /commsearch.aspx?keyword=GPU \t _blank GPU? HYPERLINK /commsearch.aspx?keyword=%cd%bc%d0%ce%b4%a6%c0%ed%c6%f7 \t _blank 图形处理器? HYPERLINK /commsearch.aspx?keyword=AMD+GPU \t _blank AMD GPU? HYPERLINK /commsearch.aspx?keyword=NVIDIA+GPU \t _blank NVIDIA GPU?   作为图形工作站标志性的配件,专业显卡良好的抗锯齿功能帮助图形工作站处理复杂的三维模型,保证线条的光滑。除线条抗锯齿功能,专业显卡对重叠图形、动态光源、图形剖切等操作的处理,与普通显卡也有着非常大的不同。作为专业显卡领域仅有的两家厂商,AMD和NVIDIA的专业显卡在性能和价格上都日益趋于同质化,纯粹的从性能和价格两方面来讨论两家产品孰优孰劣已不合适。为了更加深入的了解两家厂商专业级显卡产品的硬件特性,e-works将从两家厂商的GPU架构着手来讨论两家产品的优势及不足。   一、GPU与显卡   简单来说,GPU与显卡的关系就好比CPU与主板的关系,主板有了CPU才有了动力之源,利用CPU提供的动能,主板才可以实现各种功能。同理,显卡之所以能加速图形图像处理,也是因为GPU为显卡提供了强大的运算能力。专业显卡发展到今天,无论是AMD还是NVIDIA,功能上已经日趋同质化,NVIDIA专业显卡能实现的功能,AMD也能实现,但从GPU运算能力来讲,两家厂商还是有一定可比较性。   二、AMD与NVIDIA的GPU架构   对于像素的特点,相关的文章也讨论的比较多。任何一个像素都包含着两种不同的属性信息,即色彩和坐标。色彩信息包括RGB三原色和一个信息通道Alpha;坐标信息包括XYZ三维坐标信息和一个重力元素W。为对像素完成一次色彩计算和坐标转换,GPU的顶点着色单元和像素着色单元从一开始就被设计成为一个周期内具备4次运算能力的逻辑运算器,这便是4D矢量逻辑运算器的由来。   (1)AMD基于SIMD结构的流处理器   AMD的GPU采用的是SIMD架构模式,SIMD即Single Instruction Multiple Data,单指令多数据,这种架构能很好的对像素的色彩和坐标所包含的四维数据进行运算。传统的顶点单元和像素单元中的ALU都能在一个周期内完成对4D矢量数据的运算。因此,通常称这种逻辑运算器为4D ALU。 图1 SIMD架构   图1为SIMD架构流处理器的运算模式,通过唯一的指令发射端向所属的ALU发送运算需求,ALU在接收到运算指令后开始并行计算。需要注意的是,4D SIMD架构虽然很适合处理4D指令,但遇到1D指令的时候效率便会降为原来的1/4。此时的ALU, 3/4的资源都被闲置。为了提高像素单元和顶点单元执行1D 2D 3D指令时的资源利用率,从DirectX9时代开始,AMD的GPU通常采用1D+3D或2D+2D ALU。这便是Co-issue技术。这种ALU对4D指令的计算时仍然效能与传统的ALU相同,但当遇到1D 2D 3D指令时效率则会高不少,例如如下指令:   ADD R0.xyz , R0,R1???   //此指令是将R0,R1矢量的x,y,z值相加 结果赋值给R0   ADD R3.x , R2,R3?????   //此指令是将R2 R3矢量的w值相加 结果赋值给R3   对于传统的4D ALU,显然需要两个周期才能完成,第一个周期ALU利用率75% ,第二个周期利用率25%。而对于1D+3D的ALU,这两条指令可以融合为一条4D指令,因而只需要一个周期便可以完成,ALU利用率100%。但当然,即使采用co-issue,ALU利用率也不可能总达到100%,这涉及到指令并行的相关性等问题,而且,更直观的,上述两条指令显然不能被2D+2D ALU一周期完成,而且同样,两条2D指令也不能被1D+3D ALU一周期完成。传统GPU在对非4D指令的处理显然不是很灵活。 图2 AMD 5D ALU流处理器   为进一步改善流处理器的运算性能,AMD推出了代号为R600的显卡核心,该GPU采用了统一渲染架构,采用了5路超标量运算单元,通过在流处理器内部集成5个1D标量运算单元,每一个流处理器都能进行1+1+1+1+1或1+4或2+3等方式搭配运算。同时,为提升ALU运算效率,AMD 采用了VLIW体系设计,将多个短指令合并为一个超长指令交给流处理

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档