第三个阶段.ppt

下载文档 降价啦

10
0
约1.05万字
约 51页
2017-05-26 发布于天津
举报
版权申诉
保障服务

第三个阶段.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第三个阶段

第三章 Intel处理器架构发展简史指令集架构(Instruction Set Architecture) Intel N处理器的硬件架构内存的工作原理，cache工作原理 (介绍CUP、Register、caches、Memory 、Bus 、Branch Prediction 、Trace Cache 、Out of order等概念) 处理器执行指令的三个阶段单指令多数据技术(SIMD Technology) 超流水线技术浏览IA-32的发展简史 Intel Pentium MMX 技术 Intel MMX 技术使用在单指令多数据 (SIMD) 执行模式，在64-bit MMX寄存器上包含打包的整形数据(packed integer data)完成并行计算。提高性能在：高级多媒体应用图形处理数据压缩应用 Intel 处理器(IA-32, IA-64) Intel Pentium 4 处理器 IA-32是第一个基于Intel NetBurst 微架构的处理器 Intel NetBurst 微架构是一个新的 32位微处理器以比以往IA-32处理器更高的时钟速度和性能等级操作第一次实现Intel NetBurst 微架构迅速运转的引擎超流水线技术动态执行新的缓存子系统 Intel处理器的硬件架构Intel NETBURST 微架构 NetBurst 微架构的重要特性: 迅速执行的引擎算术逻辑单元 (ALUs) 以双倍的处理器频率运行简单整型操作以1/2处理器Clock执行提供高吞吐量并且减少执行延迟超流水线技术 20级流水线技术居桌面PCs 和服务器产业芯片时钟速率之首提供主频（headroom）高度和可计量性这些技术，有发展前景先进的动态执行高级的分支预测算法新的cache子系统 Intel? NetBurst? 微架构重要特性超流水线技术使时钟速度和频率(headroom)达10 GHz Intel NetBurst 微架构系统总线达到400 MHz高性能，具有(quad-pumped) 接口的 Intel NetBurst 微架构系统总线。快速执行引擎减少基本整型指令的延迟使之能够并行乱序执行超量流水使之能够并行化重命名硬件寄存器避免名称空间的限制 64和128 字节的特色cache 有特色的硬件预取 Intel? NetBurst? 微架构重要特性存储结构 Intel? NetBurst? 微架构 Intel Pentium 4 Xeon处理器 Intel? Pentium? 4 处理器 Streaming SIMD Extensions 2 (SSE2)数据流 Intel Netburst? 微架构 Intel Xeon? 处理器＋支持多处理器超线程技术 (HT) 在一些服务器配置中，3级（ on die） cache 指令集架构（ISA）作为一个程序员，我们不想面对微处理器，用微代码手工送每次和每个控制信号，我们宁愿抽象这些指令送给微处理器，而让微处理器设计者处理抽象指令，解码成微代码的控制操作。相当于机器和汇编语言级的机器指令集架构视图。高级语言程序汇编代码机器代码简化计算机内存架构处理器的Caches 小的高速内存称为Caches,用于提高物理内存的延迟。 Pentium处理器总有两个caches叫做L1 cache和L2 此cache,并且它可能有一个可选的L3 cache 典型使用在服务器上的。使用L1 cache只存储数据，使用trace-buffer存储指令, 它是小的但是非常快。调用联合cache, 使用L2 cache既存储指令又存储数据。它比L1 cache长32倍并且慢3倍。主内存是更大的。典型的超过128 megabytes,但它比L1 cache慢十倍。处理器工作原理当应用程序存取一段内存时，无论是Data load/store，处理器最初在cache中寻找数据。如果数据已经在cache中，cache bit出现，数据从cache中存取，没有接触主内存。当cache miss出现，需要的数据不在cache中，并且它需要从主内存中预取。取代需要若干字节或多个字节的请求，处理器预取64-byte块到cache中,期望存取内存额外用的时间更短。64-byte cache排列成64 byte为边界一行。例如：第70 byte 将从64-127 byte中读取。内存从Pentium 4 处理器角度来看，内存是出奇的慢。如此慢几乎每个应用程序它的性能受限制。在执行指令之前，由于强迫处理器等待指令从内存中预取，所以缓慢的内存伤害了性能。等待指令占据指令池，它也可能会塞满，留下处理器没