- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一个好汉三个帮——协处理器技术剖析
一个好汉三个帮——协处理器技术剖析
毫无疑问,多核是今后CPU发展的主旋律。不过,随着技术的成熟,多核处理器的架构也将发生一个显著的变化,那就是从通用的对等设计转移到“主核心+协处理器”的新型架构,即处理器中只有一个或数个通用核心承担任务指派功能,而浮点运算、HDTV视频解码、Java语言执行等功能都由专门的DSP硬件核心来完成,以实现处理器执行效率和性能的最大化。
继往开来——协处理器的发展历程
所谓协处理器,就是一颗能与CPU协同工作,帮助CPU完成特定任务的专用处理芯片。由于协处理器往往是针对某些特定应用(如浮点运算)而设计,所以设计时不必考虑太多的通用性,协处理器往往拥有很高的性能,完成特定任务时可以把现有CPU远远抛在后面。举个例子,ClearSpeed公司就发布了一款基于协处理器的PCI Express板卡,该卡的浮点性能高达50Gflops(Giga FLoating point Operations per Second,每秒十亿次浮点运算),比当前桌面PC强10倍。要知道,就算Intel面向高端服务器的4路Montecito(双内核)系统也仅获得45GFlops的浮点性能!协处理器的威力可见一斑!
ClearSpeed的协处理器板卡外观
事实上,协处理器很早就在PC市场大展身手了。8087就是Intel设计的第一个数学辅助处理器,它与Intel的8088和8086微处理器成对工作,可以加速应用程序的浮点运算速度,针对不同的特定应用,速度提升从20%到500%不等。真正让电脑用户对协处理器印象深刻的当数80387芯片了,当时它被很多386主机搭载,主频与CPU速度匹配。当CPU发展到486时代,协处理器就从人们的视线中消失了。事实上,这种情况的出现主要得益于半导体制造工艺的进步。以往由于技术的限制,一个芯片内不能同时封装ALU(Arithmetic Logic Unit,算术逻辑单元)和FPU(Float Point Unit,浮点运算单元)两个单元,而80486使用了1微米制造工艺,首次实破了芯片内100万个晶体管的限制,FPU从此就在CPU内部“安家”了。
80387协处理器芯片
尽管协处理器在80486之后不再成为主流,但这并不意味着它已经消亡,在高端服务器、专业设计等领域还能看见它的“身影”,甚至我们今天熟悉的多媒体手机,也是协处理器活跃的舞台。Intel、NVIDIA、ATI针对手持设备推出的图形芯片,就是不折不扣的协处理器,它们可以大幅提升手机的图形处理能力。时隔多年,协处理器再次引起Intel、AMD两大厂商的注意,并把它们作为未来产品的标准功能,其中的功臣当数Cell处理器。
四两拨千斤——Cell带来的启示
Cell是IBM、SONY、TOSHIBA联合推出的处理核心,它将率先使用在SONY的新一代游戏机PS3上。Cell可以提供高达256Gflops的单精度浮点性能,而它只使用了2.34亿个晶体管,能源利用效率比现在设计最佳的RISC和x86处理器高出数十倍!Cell的“魔力”究竟来自哪里?答案就是它集成了多个协处理器。
Cell总共集成了9颗处理核心,但其中只有1颗名为PPE(Power Processor Element,主处理单元)的核心具备现代CPU的通用处理功能,而其它8颗名为SPE(Synergistic Processor Element,协处理单元)的核心则专门针对浮点运算进行优化。PPE负责任务的分配,SPE则在PPE的指挥下完成复杂的计算工作。SPE的作用就如同80387协处理器,而PPE就像80386处理器一样,两个体系的差别很明显,80386同80387协处理器是分开的,而Cell则把它们集成在一起。由于SPE只完成特定的任务,因此每个SPE占用的晶体管并不会多。在晶体管数目相差不多的情况下,“主处理器+协处理器”的架构能获得更强的性能!
多颗协处理器让Cell表现出惊人的性能
我们知道,当前x86处理器使用了通用的处理核心,为了同时提高整数和浮点性能,晶体管消耗越来越多,但性能的增长并没有同晶体管的增长成正比。尽管业界使用优化处理架构、增加通用处理核心等手段,但它们还不是根本的解决方法。未来CPU如何再次突破发展的瓶颈?Cell的设计思想非常值得借鉴。我们知道,当前高清视频处理是非常占用CPU资源的,如果在CPU内专门设置一个针对视频处理的协处理器,效率肯定要高上好多倍,而且这种实现并不需要很多晶体管。事实上,不只视频处理, 3D渲染、物理处理这些任务也可以转移至协处理器上来完成。“x86+协处理器”的架构将成为未来桌面CPU的标准设计模式!
海纳百川——剖析AMD的协处理器架构
1.Torrenza平台欲引
您可能关注的文档
- 《诗经》中的民歌代表作与中国文学的现实主义源头.doc
- 《记叙文阅读》教学课件.ppt
- 《诚实的孩子人人夸》活动设计.doc
- 《话术演练通关》保险培训课件专题.ppt
- 《说屏》课堂教学实录.doc
- 《读懂爸爸妈妈的心》说课.doc
- 《课程与教学论》期末综合练习.doc
- 《货币银行学》课后答案 戴国强.doc
- 《资源与运营管理》形考作业答案参考.doc
- 《谁选择了它们》省优质课.doc
- 中考语文复习专题二整本书阅读课件.ppt
- 中考语文复习积累与运用课件.ppt
- 2025年初中学业水平考试模拟试题(二)课件.ppt
- 四川省2015届理科综合试题48套第12套.pdf
- 【课件】战争与和平—美术作品反映战争+课件-2024-2025学年高中美术湘美版(2019)美术鉴赏.pptx
- 【课件】青春牢筑国家安全防线 课件 2024-2025学年高中树立总体国家安全观主题班会.pptx
- 【课件】原始人的创造+课件高中美术湘美版(2019)美术鉴赏.pptx
- 上海证券-美容护理行业周报:流量加快去中心化,强运营头部品牌影响较小 -2024-.pdf
- T_CSEIA 1005—2023_能源工业互联网平台数据治理要求.pdf
- T_CDSA 504.16-2023_急流救援技术培训与考核要求.pdf
文档评论(0)