重归正途迎未来AMD全新GPU构架深度解析.docVIP

  • 2
  • 0
  • 约1.09万字
  • 约 28页
  • 2018-04-23 发布于河南
  • 举报

重归正途迎未来AMD全新GPU构架深度解析.doc

重归正途迎未来AMD全新GPU构架深度解析

重归正途迎未来 AMD全新GPU构架深度解析 CBSi中国·ZOL 作者:中关村在线 顾杰 责任编辑:林光楠 【原创】 2011年06月23日 05:00震惊世界的Graphics Core Next● 震惊世界的Graphics Core Next     2011年6月15日,AMD在AMD Fusion开发者峰会上向与会的700多名开发者和PC业界高管们透露了其全新GPU架构的诸多细节,由于缺乏代号,因此该构架暂时被称作Graphics Core Next。   AMD下一步的目标是发展“针对图形、计算双重优化的统一可扩展GPU”,“一套面向吞吐量的大规模多线程计算单元架构”,包括多任务多引擎架构、计算单元架构、多级读写缓存架构。 AMD Graphics Core Next   尽管新构架的路线图、发布规划、规格参数、功能特性等一概欠奉,但Graphics Core Next的出现依旧瞬间吸引了全世界所有的目光,因为——你还记得AMD上一次推出具有颠覆性的全新构架,是什么时候的事情吗? R600的前世今生   ● R600的前世今生     如果我没记错的话,上一次AMD发布与前代产品完全不同的新构架,已经是近5年前的事了。   2007年5月,AMD收购ATI之后推出的第一款DirectX 10 GPU—R600正式发布了。R600由一套几何处理单元,独立的线程仲裁器UTDP,与仲裁机构相连的SPU和TMU单元,以及完整的后端所组成。整个构架以ringbus换装总线进行连接。与竞争对手G80相比,R600的结构可以说是完全不同的两种设计思路。他的运算部分采用4个非全功能1D ALU和1个全功能4D ALU以VLIW的形式打包组成一个VLIW core。5个ALU共享2套发射端口资源,全部64个VLIW core共享8K的GDS,也就是NVIDIA方面的shared memory。 R600构架   R600构架的目的或者说初衷之一,就是通过ATI长久以来对图形编程业界的影响力,将自己认为更加合适的追求吞吐和ILP性能的保守的编程模式推广下去。压迫程序员并迫使其遵从由ATI制定的被认为是适宜的编程方法以及API转换路线。当时的实践证明,这一尝试是失败的。 RV770构架   在经历了R600系列的失败之后,AMD通过RV670的tick过程修正为R600构架去除了大量的低效率的晶体管,如过于臃肿的MC部分以及缓慢的ringbus总线。这些举措都为RV770节约了大量的晶体管资源。利用这些晶体管资源,RV770成功的将运算资源提升至R600的250%,但其构架本身并没有明显的变化。 RV870构架   而接下来的RV870中,AMD仅为其配备了合乎DirectX 11要求的寄存器资源,改进了UTDP对多线程的支持,在前端的几何单元中插入了一组TS单元,同时将运算单元中的GDS提升到了64K。除此之外,我们仅能见到进一步放大的VLIW core规模和其他配套的纹理资源及后端资源。各资源的整体比例较之RV770并未发生本质性的改变,VLIW core的操作管理方式及周边资源密度也未见任何实质性的变化。 Cayman构架   到Cayman构架为止,R600这个构架已经被AMD反复修改了不知道多少遍,虽然Cayman构架对R600进行了历史上最大的一次改动,4D VLIW以及双几何引擎的加入让Cayman构架获得了R600系列优于RV870的DX11性能,但其最核心的通过VLIW提升吞吐能力并由简单暴力的单元扩张换取性能的做法,并未发生本质变化,这种做法在漫长的历史时期里都发挥着重要的作用。   现在看来,Graphics Core Next的出现,标志着R600这个颇为长寿的构架体系,终于到了垂垂暮年,行将替换了。 产品:Radeon HD 6970 AMD 显示芯片 全新构架新在哪里   ● 全新构架新在哪里   AMD本次发布的全新构架究竟新在哪里呢?下面不妨让我们丢开那些构架图,直接归纳总结一下此次新构架的特点。 Graphics Core Next添加的Scalar单元简介   1、取消VLIW吞吐,代之以常规SIMD方式。   2、添加完整的多级Unifield Cache体系,cache体系面向全部指令和数据开放,同时取消独立的Tex Cache。   3、强化原子操作。   4、构架基于并行Compute Unit结构,强化CU间以及基于线程块级的乱序执行能力。   5、改进ALU团簇结构,新构架将采用4组16 wide vector ALU捆绑的形式。   6、ALU团簇外添加全新的Scalar Unit。   7、加入统一定址   8、添加对ECC内存的支持。   …… Graphic

文档评论(0)

1亿VIP精品文档

相关文档