网站大量收购独家精品文档,联系QQ:2885784924
  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
行情资讯

【行情资讯】Nehalem微架构细节前瞻 - 前言   2006年Intel发布了全新的处理器架构:酷睿2(Core 2),该架构衍生自原本用于移动平台的Pentium M架构(后改为Core 1)。酷睿2架构出色的性能、平衡的功耗以及极强的超频潜力令Intel一改Pentium 4时代的颓势,完成了一场彻彻底底的翻身仗。AMD为了抵挡酷睿2处理器猛烈的攻势,不得不将自己原本春风得意的K8处理器的价格一降再降,另一方面则开发新一代处理器以应对。2007年,AMD终于发布了崭新的羿龙处理器,然而Intel也随之发布了酷睿2的改进版,伴随着一系列新技术的Penryn系列处理器,Intel依然屹立在处理器市场的顶峰。   学如逆水行舟,不进则退,对于一个企业的技术发展来说亦是如此。居安思危的Intel并未因为得势而停止前进的脚步,依然严格履行着2年一次架构革新的计划。今年第四季度,即酷睿2架构发布2年之后,Intel代号为Nehalem的新一代微架构就将与我们见面。   Nehalem其实并非最终的商业产品名称,而只是一个代号。Nehalem微架构依然基于酷睿架构的发展,不过作为新一代架构,其新特性自然要比Penryn处理器多得多也大得多,相当值得期待。下面笔者就为各位详解Nehalem微架构的一些新特性,让大家先睹为快。更快的并行处理   在不借助软件辅助的情况下,提高处理器对乱序执行能力是增强并行处理能力的一种途径。为了能够鉴别更多的可并行处理的独立操作,Intel在Nehalem微架构中提高了乱序指令窗口和调度器的规格,为其提供足够的便捷通道。同时Intel还增加了各类缓存的容量以进一步减少限制因素。   Nehalem的乱序执行引擎依然是由Core 2甚至可以说由Yonah一脉相传而来,正如Intel所介绍的一样,它主要是提升了规格及缓存容量。Nehalem的微指令缓存增加幅度很大,比Core 2增加了几倍,这会很有帮助。但在重排序缓存(Reorder Buffer)和保留站(Reservation Station)方面的增幅分别为50%和12.5%,而当年的Core 2相比比Yonah的增幅为100%和33%。更重要的是Nehalem每周期微指令的处理数量上依然和Core 2一样是4个,而Yonah是3个,同时执行单元方面Nehalem没有做出任何变动。就此方面的综合提升幅度来讲,Core 2至Nehalem可能不如Yonah至Core 2明显。   更强的乱序执行引擎除了单纯提升性能之外,显然是为了一件事准备的,那就是超线程技术的回归。   Intel的超线程技术自Pentium 4E处理器之后就在桌面处理器中销声匿迹,如今Intel为Nehalem带来了加强版的超线程技术,命名为:Simultaneous Multi-Threading(SMT)。超线程技术的回归得益于Nehalem架构更大的缓存以及带宽,Nehalem架构中需要静态分配给每个线程或者需要线程共享的资源都比Core 2架构大幅增加了,这使得该技术能够发挥更显著的作用。SMT技术将允许一个核心同时处理两个软件线程,极大的加强了处理器的并行处理能力。同时SMT技术主要基于更高的资源利用率,Intel表示该技术可以在极少的能量消耗的情况下提升20%-30%的性能(和当年超线程P4的宣传数值差不多)。至于该技术究竟表现如何就要等到Nehalem发布才能知道了。 小知识:乱序执行的含义。   通常情况下,处理器将会按照指令获取顺序来处理指令,不同的指令会消耗不同的时间。例如下面这段指令:   在顺序执行的情况下处理器必须按照指令顺序一个个执行,否则就会出现问题。如果在3尚未完成之前去执行4,那么MEM[1032]就会因为R1寄存器改变而被赋予错误的数值。   而事实上我们可以发现1、2、3跟4、5、6并没有什么实际的联系,而仅仅是都使用了R1寄存器。因此,通过重命名寄存器,完全可以实现并行处理,例如让4、5、6指令去使用R2寄存器(如上图)。很明显,通过乱序执行可以大大提升处理器的并行能力。而物理寄存器数量越多,则重排序工作就能够越便捷。 更强的分支预测   每一代新架构推出时,Intel都会改进原有算法中可能造成性能损失或者产生无效周期的部分。Intel在Nehalem微架构中针对多线程软件做出了进一步优化,在硬件预读和存取调度上有进一步提升(例如内存潜伏期将更低),最重要的是分支预测的改进。   分支预测就是指去猜测一个条件分支是否将被调用,也就是预先猜测应用程序下一步要做什么。分支预测在当今的处理器领域是至关重要的,出色的分支预测可以提供很高的性能。分支预测可以让处理器直接选取和执行指令,而不用等到分支条件最终确认。举一个简

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档