IntelSandyBridge详解.docVIP

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IntelSandyBridge详解

如果翻看几年前的资料,可以发现,在那时候,英特尔处理器32nm制程下的两个微架构分别是Nehalem-C和GESHER,尤其是后一个,对我们来说是相当陌生的。 ? 几年前的资料,今天的微架构代号为GESHER   当然很多读者能猜得出,昔日的Nehalem-C就是今天的Westmere(Clarkdale核心Core? i5/i3的微架构),而GESHER无疑就是最火热的Sandy Bridge(SNB)。   在希伯来文中,GESHER是桥梁的意思,对于Sandy? Bridge来说,这是一个恰如其分的比喻,它是英特尔三个分割世界的综合体:融合了P6(代表Pentium? Pro)、NetBurst(代表Pentium? 4)的特性,并整合了新一代图形核心,这样的结果使得一个创新的微架构集成在32nm制程的单芯片上。   英特尔的“Tick-Tock”战略众所周知,“制程技术-微架构”交替更新,偶数年带来新架构,而奇数年则带来工艺的进步。在2010年伊始,英特尔就将制程提升到了32nm, 而今年微架构将升级到新一代的Sandy? Bridge。   历史的钟声刚刚在2011年敲响,英特尔新一代微架构Sandy Bridge就正式发布了,在今后一段时间内, 它将是所有目光的聚焦点。 Sandy Bridge微架构简介   Sandy? Bridge是一个全新的基于昔日P6和NetBurst微架构某些元素的集合,虽然它比较相似于P6,但是还是存在着较大的不同,当然了,上一代Nehalem的上一代Core微架构也是脱胎于P6,Sandy? Bridge也深深烙下了P6的印记。而像uop缓存和physical register? file(物理寄存器文件),它们都是从NetBurst微架构上汲取过来的。总体上,Sandy? Bridge的每个方面都较上一代Nehalem有所提高。 ? Sandy Bridge核心图   虽然Sandy? Bridge还是采用的32nm制程,但相较于Westmere,它真正将GPU与CPU融合,从以前的双U各立山头到合二为一,就是非常大的突破。当然Sandy? Bridge的变化并不仅限于此,其主要特性还有:    ? 32nm工艺全新微架构,性能更高功耗更低      –新的分支预测单元      –新的Uop缓存      –新的物理寄存器文件      –有效执行256位指令      –放弃QPI,改用环形总线      –最末级缓存LLC机制      –新鲜的系统助理    ? 32nm工艺新一代图形引擎,出色的媒体与视频性能    ? 高级矢量扩展指令集(Intel AVX),加快浮点运算密集型应用    ? Turbo Boost 2.0睿频技术,动态调控CPU和GPU频率   从Nehalem开始,英特尔将处理器核心分为了核心(Core)与非核心(Uncore)两部分, 我们在讲述Sandy Bridge架构上改进的时候,也将分开Core和Uncore来叙述,不过需要先了解一下CPU内部的工作流程。 ? CPU工作流程   P6是首个乱序执行(Out of Order Execute)的微架构,作为P6繁衍的产品,Sandy Bridge和Nehalem都是采用乱序执行超标量(Superscaler)x86指令的架构,其内部的工作流程基本如下:   一套完整的计算机程序是由很多指令组成的。在执行前,程序首先被加载到内存中,程序执行时,处理器首先要从内存或高速缓存中获取指令,这个过程被成为取指 (Instruction Fetch)。在处理器取到指令后,需要判断这条指令是什么类型的指令,究竟要执行什么操作,这个过程被称为译码 (Decode)。在指令被译码后,需要为这条指令分配它计算所需要的资源,例如加法器等,这个过程被称为分派和发射 (Dispatch和Lauch);指令在计算单元中具体执行的过程被称为执行 (Exectue);执行结束后,需要将运行结果存回目标地址,这个过程被称为回写 (Write Back)。   如图上所示,在处理器内部的电路单元设计与上述过程是一一对应的。Sandy? Bridge对比Nehalem在核心部分就以上每方面都做了相应的改进。   在深入了解Sandy Bridge微架构之前,首先我们先来了解一下Nehalem微架构处理器的核心功能区间划分: ? Nehalem核心微架构图   Nehalem微架构中的任何一款处理器其核心(Core)部分的电路设计均如图上所示,只有非核心(Uncore)部分不同,以及是否遮蔽了超线程技术。Sandy?Bridge微架构采用了同样的方法用以划分高、中、低端产品。   从下文开

文档评论(0)

youshen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档