西安理工大学《微机原理及应用A 》32位微机09.pptVIP

下载本文档

6
0
约8.03千字
约 57页
2017-07-25 发布于浙江
举报
版权申诉

西安理工大学《微机原理及应用A 》32位微机09.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

微机原理与接口技术－－基于IA-32处理器和32位汇编语言·第4版第9章处理器性能提高技术第 9 章处理器性能提高技术 9.1 精简指令集计算机技术 9.2 指令流水线技术 9.3 浮点数据处理单元 9.4 多媒体指令教学要求掌握CPU性能公式，熟悉RISC的主要特点掌握指令流水线技术特点和指令相关问题，理解80486指令流水线理解浮点数据格式，掌握单精度和双精度规格化浮点数的编码了解x87 FPU浮点寄存器，熟悉舍入控制，了解浮点指令编程了解多媒体指令MMX、SSE、SSE2、SSE3的特点理解紧缩数据类型和多媒体指令的操作特点，熟悉环绕运算、饱和运算、水平运算第9章习题 9.1 简答题（1、2、3、4、5） 9.2 判断题（1、2、3、4、5） 9.3 填空题（1、2、3、4、5） 9.6 9.8 9.9 9.10 9.14 9.1 精简指令集计算机技术精简指令集计算机技术起源向量巨型机CRAY-I：精简指令、面向寄存器操作 IBM 801小型机：单周期固定格式指令、高速缓冲存储器以及编译技术相结合 RISC-I：第一个精简指令集计算机处理器芯片在高档的工程工作站得到广泛应用最新开发的处理器普遍采用精简指令集计算机设计思想 9.1.1 复杂指令集和精简指令集复杂指令集计算机CISC 指令系统丰富、程序设计方便、程序短小、执行性能高处理器硬件复杂，不易使用先进的流水线技术，导致其执行速度和性能难以进一步提高精简指令集计算机RISC 指令系统很简单，只有少数简单、常用的指令处理器硬件简单，比较方便地实现优化处理器性能公式处理器执行时间＝IC×CPI×T IC＝程序的指令条数 CPI＝执行每条指令所需的平均时钟周期数 T＝每个时钟周期的时间（时钟频率的倒数）处理器执行程序时间越少，计算机性能越高减少时钟周期时间T，即提高时钟频率 CISC通过使用复杂指令减少IC RISC使用简单指令减少CPI 9.1.2 RISC技术的主要特点指令条数较少寻址方式简单面向寄存器操作指令格式规整单周期执行先进的流水线技术编译器优化 …… 9.2 指令流水线技术洗衣房的流水作业三个阶段： 1. 水洗(30) 2. 烘干(40) 3. 熨烫(20) 9.2.1 指令流水线 1. 流水线思想指令流水线技术：把执行指令这个过程分解成多个子过程，执行指令的功能单元也设计成多个相应的处理单元，多个子过程在多个处理单元并行操作，同时处理多条指令没有减少每个指令的执行时间有助于减少整个程序（多条指令）的执行时间指令流水线开始需要“填充时间（Fill）”，最后有一个“排空时间（Drain）” 指令流水线的时空图 2. 流水线中的指令相关指令相关：指令之间存在相互依赖关系常使下一条指令无法在设计的单位时间内执行导致流水线的“断流”，性能降低有三种类型的指令相关资源冲突：当指令重叠执行过程中，硬件资源满足不了指令重叠执行的要求数据相关：在同时执行的多条指令中，一条指令依赖前一条指令的执行结果(数据)无法得到控制相关：流水线遇到分支指令或其他改变PC值的指令 9.2.2 80486的指令流水线 5级指令流水线，每级1个时钟周期 ? PF??指令预取（prefetch） ? D1??指令译码1（decode stage 1）对所有操作码和寻址方式信息进行译码 ? D2??指令译码2（decode stage 2）将操作码扩展为ALU控制信号，存储器地址计算 ? EX??指令执行（execute）完成ALU操作和Cache存取 ? WB??回写（write back）更新在EX步骤得到的寄存器数据和状态标志数据旁路（直通） MOV reg1, mem1 ADD reg1, reg2 MOV mem2, reg1 流水线停顿 MOV reg1, mem1 ADD reg2, [reg1] 预取分支目标 CMP reg, imm JC target …… target： 9.3 浮点数据处理单元传统的处理器或简单的微控制器只有整数处理单元有些实数经过移动小数点位置，可以用整数编码表达和处理，但可能要损失精度实数经过一定格式转换后，完全用整数指令仿真，但处理速度难尽人意计算机表达实数要采用浮点数据格式 x87 FPU（Floating-Point Unit） Intel 80x87浮点协处理器与80x86处理器配合 80486及以后的IA-32处理器集成浮点处理单元 9.3.1 实数编码实数（Real Number）的科学表示法表达 -123.456＝-1.23456×102 包括三个部分指数：反映数据的大小或量级有效数字：反映数据的精度符号