- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
INTEL SNB 让我欢喜让我忧
INTEL SNB 让我欢喜让我忧
2011年1月9日,在万众瞩目之下,INTEL发布了新平台Sandy Bridge(SNB),首先让我们看看INTEL新发布的SNB平台到底带给了我们什么!
Sandy Bridge处理器无疑是今年CPU市场的重磅炸弹,其超强的性能表现引起多方关注。特别是其集成的核芯显卡性能更是让很多人感到集显真的也能做到独显才能做到的事情,彻底摆脱了集显是鸡肋的阴影。那么即将发布的Sandy Bridge处理器又将带来什么样的惊喜呢?依据笔者从各种途径得来的消息,总体上新的处理器具备以下六大亮点:
一、AVX(高级矢量扩展)技术
在Sandy Bridge中最重要的应用恐怕就是AVX(高级矢量扩展)技术,这项新技术据说可以大幅度提升处理器在高密集浮点运算中的性能。intel宣称,使用AVX技术进行矩阵计算的时候将比SSE技术快90%。
二、微指令缓存以及RPF(寄存器)改进
Sandy Bridge里又增加了一个微指令缓存,用于在指令解码时临时存放。在取硬件获得一个新指令的时候,首先检查它是否存在于微指令缓存中,如是前端关闭缓存为其余管线服务,结束了这个X86管线中非常复杂的过程,能够节约大量功耗。
和AMD的推土机、山猫一样intel也引入了物理寄存器。Core Duo时代是80-bit,加入SSE指令集后增至128-bit,现在又有了AVX指令集,按照趋势会翻番至256-bit。微指令缓存的彻底改变了原由的模式,微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据本身。有效的减少了转移数据时数据流的吞吐量,降低了功耗减少了核心面积。这样AVX指令集才得以实现,以最小的核心面积代价,Intel将所有SIMD单元都转向了256-bit。AVX支持256-bit操作数,相当消耗晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满足更高吞吐量的浮点引擎。
借由128bit的整数SIMD数据路径实现每周期内进行两个256-bit AVX操作,而原有128bit通道的功耗并不会因此而改变。AMD推土机架构对AVX的支持则有所不同,使用了两个128-bit SSE路径来合并成256-bit AVX操作,即使八核心(四模块)推土机的256-bit AVX吞吐量也要比四核心SNB少一半。SNB架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍。SNB的整数执行也有了改进,只是比较有限。ADC指令吞吐量翻番,乘法运算可加速25%。
三、环形总线
在Sandy Bridge中我们将会看到一个和以往不大一样的总线架构,在新处理器中会出现一个和服务器版的Nehalem-EX、Westmere-EX类似的架构,每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引擎、系统助手(System Agent)都在这条线上拥有自己的接入点,就如同一个公用的平台一样。这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟。随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心、更大服务器集群。
这样,Sandy Bridge每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点。三级缓存的延迟也从大约36个周期减少到26-31个周期。此前预览的时候我们就已经感觉到了这一点,现在终于有了确切的数字。三级缓存现在被划分成多个区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以访问全部三级缓存,只是延迟不同。此前三级缓存只有一条缓存管线,所有核心的请求都必须通过它,现在很大程度上分而治之了。
和以前不同的是,三级缓存的频率现在也和核心频率同步,因而速度更快,不过缺点是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三级缓存,速度就慢下来了。
四、整合图形核心
在之前的intel架构中也有整合图形核心存在,比如现在的酷睿i3以及奔腾E6500等。它们虽然也自带了图形核心,但与CPU是双内核封装,只是通过45nm工艺、更多着色硬件、更高频率提升了性能。Sandy Bridge则不然,CPU、GPU封装在同一内核中,全部采用32nm工艺,特别是显著提高了IPC(指令/时钟)。
Sandy Bridge GPU有自己的电源岛和时钟域,也支持Turbo Boost技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制GPU使用多少缓存。将图形数据放在缓存里就
原创力文档


文档评论(0)