网站大量收购独家精品文档,联系QQ:2885784924

一个好汉三个帮——协处理器技术剖析.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一个好汉三个帮——协处理器技术剖析

一个好汉三个帮——协处理器技术剖析   毫无疑问,多核是今后CPU发展的主旋律。不过,随着技术的成熟,多核处理器的架构也将发生一个显著的变化,那就是从通用的对等设计转移到“主核心+协处理器”的新型架构,即处理器中只有一个或数个通用核心承担任务指派功能,而浮点运算、HDTV视频解码、Java语言执行等功能都由专门的DSP硬件核心来完成,以实现处理器执行效率和性能的最大化。 继往开来——协处理器的发展历程   所谓协处理器,就是一颗能与CPU协同工作,帮助CPU完成特定任务的专用处理芯片。由于协处理器往往是针对某些特定应用(如浮点运算)而设计,所以设计时不必考虑太多的通用性,协处理器往往拥有很高的性能,完成特定任务时可以把现有CPU远远抛在后面。举个例子,ClearSpeed公司就发布了一款基于协处理器的PCI Express板卡,该卡的浮点性能高达50Gflops(Giga FLoating point Operations per Second,每秒十亿次浮点运算),比当前桌面PC强10倍。要知道,就算Intel面向高端服务器的4路Montecito(双内核)系统也仅获得45GFlops的浮点性能!协处理器的威力可见一斑!   ClearSpeed的协处理器板卡外观   事实上,协处理器很早就在PC市场大展身手了。8087就是Intel设计的第一个数学辅助处理器,它与Intel的8088和8086微处理器成对工作,可以加速应用程序的浮点运算速度,针对不同的特定应用,速度提升从20%到500%不等。真正让电脑用户对协处理器印象深刻的当数80387芯片了,当时它被很多386主机搭载,主频与CPU速度匹配。当CPU发展到486时代,协处理器就从人们的视线中消失了。事实上,这种情况的出现主要得益于半导体制造工艺的进步。以往由于技术的限制,一个芯片内不能同时封装ALU(Arithmetic Logic Unit,算术逻辑单元)和FPU(Float Point Unit,浮点运算单元)两个单元,而80486使用了1微米制造工艺,首次实破了芯片内100万个晶体管的限制,FPU从此就在CPU内部“安家”了。   80387协处理器芯片   尽管协处理器在80486之后不再成为主流,但这并不意味着它已经消亡,在高端服务器、专业设计等领域还能看见它的“身影”,甚至我们今天熟悉的多媒体手机,也是协处理器活跃的舞台。Intel、NVIDIA、ATI针对手持设备推出的图形芯片,就是不折不扣的协处理器,它们可以大幅提升手机的图形处理能力。时隔多年,协处理器再次引起Intel、AMD两大厂商的注意,并把它们作为未来产品的标准功能,其中的功臣当数Cell处理器。 四两拨千斤——Cell带来的启示   Cell是IBM、SONY、TOSHIBA联合推出的处理核心,它将率先使用在SONY的新一代游戏机PS3上。Cell可以提供高达256Gflops的单精度浮点性能,而它只使用了2.34亿个晶体管,能源利用效率比现在设计最佳的RISC和x86处理器高出数十倍!Cell的“魔力”究竟来自哪里?答案就是它集成了多个协处理器。   Cell总共集成了9颗处理核心,但其中只有1颗名为PPE(Power Processor Element,主处理单元)的核心具备现代CPU的通用处理功能,而其它8颗名为SPE(Synergistic Processor Element,协处理单元)的核心则专门针对浮点运算进行优化。PPE负责任务的分配,SPE则在PPE的指挥下完成复杂的计算工作。SPE的作用就如同80387协处理器,而PPE就像80386处理器一样,两个体系的差别很明显,80386同80387协处理器是分开的,而Cell则把它们集成在一起。由于SPE只完成特定的任务,因此每个SPE占用的晶体管并不会多。在晶体管数目相差不多的情况下,“主处理器+协处理器”的架构能获得更强的性能!   多颗协处理器让Cell表现出惊人的性能   我们知道,当前x86处理器使用了通用的处理核心,为了同时提高整数和浮点性能,晶体管消耗越来越多,但性能的增长并没有同晶体管的增长成正比。尽管业界使用优化处理架构、增加通用处理核心等手段,但它们还不是根本的解决方法。未来CPU如何再次突破发展的瓶颈?Cell的设计思想非常值得借鉴。我们知道,当前高清视频处理是非常占用CPU资源的,如果在CPU内专门设置一个针对视频处理的协处理器,效率肯定要高上好多倍,而且这种实现并不需要很多晶体管。事实上,不只视频处理, 3D渲染、物理处理这些任务也可以转移至协处理器上来完成。“x86+协处理器”的架构将成为未来桌面CPU的标准设计模式! 海纳百川——剖析AMD的协处理器架构 1.Torrenza平台欲引

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档