- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微机原理与接口技术--基于IA-32处理器和32位汇编语言·第4版 第9章 处理器性能提高技术 第 9 章处理器性能提高技术 9.1 精简指令集计算机技术 9.2 指令流水线技术 9.3 浮点数据处理单元 9.4 多媒体指令 教学要求 掌握CPU性能公式,熟悉RISC的主要特点 掌握指令流水线技术特点和指令相关问题,理解80486指令流水线 理解浮点数据格式,掌握单精度和双精度规格化浮点数的编码 了解x87 FPU浮点寄存器,熟悉舍入控制,了解浮点指令编程 了解多媒体指令MMX、SSE、SSE2、SSE3的特点 理解紧缩数据类型和多媒体指令的操作特点,熟悉环绕运算、饱和运算、水平运算 第9章 习题 9.1 简答题(1、2、3、4、5) 9.2 判断题(1、2、3、4、5) 9.3 填空题(1、2、3、4、5) 9.6 9.8 9.9 9.10 9.14 9.1 精简指令集计算机技术 精简指令集计算机技术起源 向量巨型机CRAY-I:精简指令、面向寄存器操作 IBM 801小型机:单周期固定格式指令、高速缓冲存储器以及编译技术相结合 RISC-I:第一个精简指令集计算机处理器芯片 在高档的工程工作站得到广泛应用 最新开发的处理器普遍采用精简指令集计算机设计思想 9.1.1 复杂指令集和精简指令集 复杂指令集计算机CISC 指令系统丰富、程序设计方便、程序短小、执行性能高 处理器硬件复杂,不易使用先进的流水线技术,导致其执行速度和性能难以进一步提高 精简指令集计算机RISC 指令系统很简单,只有少数简单、常用的指令 处理器硬件简单,比较方便地实现优化 处理器性能公式 处理器执行时间=IC×CPI×T IC=程序的指令条数 CPI=执行每条指令所需的平均时钟周期数 T=每个时钟周期的时间(时钟频率的倒数) 处理器执行程序时间越少,计算机性能越高 减少时钟周期时间T,即提高时钟频率 CISC通过使用复杂指令减少IC RISC使用简单指令减少CPI 9.1.2 RISC技术的主要特点 指令条数较少 寻址方式简单 面向寄存器操作 指令格式规整 单周期执行 先进的流水线技术 编译器优化 …… 9.2 指令流水线技术 洗衣房的流水作业 三个阶段: 1. 水洗(30) 2. 烘干(40) 3. 熨烫(20) 9.2.1 指令流水线 1. 流水线思想 指令流水线技术:把执行指令这个过程分解成多个子过程,执行指令的功能单元也设计成多个相应的处理单元,多个子过程在多个处理单元并行操作,同时处理多条指令 没有减少每个指令的执行时间 有助于减少整个程序(多条指令)的执行时间 指令流水线开始需要“填充时间(Fill)”,最后有一个“排空时间(Drain)” 指令流水线的时空图 2. 流水线中的指令相关 指令相关:指令之间存在相互依赖关系 常使下一条指令无法在设计的单位时间内执行 导致流水线的“断流”,性能降低 有三种类型的指令相关 资源冲突:当指令重叠执行过程中,硬件资源满足不了指令重叠执行的要求 数据相关:在同时执行的多条指令中,一条指令依赖前一条指令的执行结果(数据)无法得到 控制相关:流水线遇到分支指令或其他改变PC值的指令 9.2.2 80486的指令流水线 5级指令流水线,每级1个时钟周期 ? PF??指令预取(prefetch) ? D1??指令译码1(decode stage 1) 对所有操作码和寻址方式信息进行译码 ? D2??指令译码2(decode stage 2) 将操作码扩展为ALU控制信号,存储器地址计算 ? EX??指令执行(execute) 完成ALU操作和Cache存取 ? WB??回写(write back) 更新在EX步骤得到的寄存器数据和状态标志 数据旁路(直通) MOV reg1, mem1 ADD reg1, reg2 MOV mem2, reg1 流水线停顿 MOV reg1, mem1 ADD reg2, [reg1] 预取分支目标 CMP reg, imm JC target …… target: 9.3 浮点数据处理单元 传统的处理器或简单的微控制器只有整数处理单元 有些实数经过移动小数点位置,可以用整数编码表达和处理,但可能要损失精度 实数经过一定格式转换后,完全用整数指令仿真,但处理速度难尽人意 计算机表达实数要采用浮点数据格式 x87 FPU(Floating-Point Unit) Intel 80x87浮点协处理器与80x86处理器配合 80486及以后的IA-32处理器集成浮点处理单元 9.3.1 实数编码 实数(Real Number)的科学表示法表达 -123.456=-1.23456×102 包括三个部分 指数:反映数据的大小或量级 有效数字:反映数据的精度 符号
您可能关注的文档
- 数电实验报告范文-实验五 加法器13.doc
- 数电实验报告范文-实验五 加法器6.doc
- 数电实验报告范文-实验五 加法器14.doc
- 数电实验报告范文-实验五 加法器16.doc
- 数电实验报告范文-实验五 加法器15.doc
- 数电实验报告范文-实验五 加法器17.doc
- 数电实验报告范文-实验五 加法器19.doc
- 数电实验报告范文-实验五 加法器20.doc
- 数电实验报告范文-实验五 加法器21.doc
- 数电实验报告范文-实验五 加法器23.doc
- 西安理工大学《微机原理及应用A 》32位微机06.ppt
- 西安理工大学《微机原理及应用A 》32位微机10.ppt
- 西安理工大学《微机原理及应用A 》32位微机04.ppt
- 西安理工大学《微机原理及应用A 》32位微机11.ppt
- 西安理工大学《微机原理及应用A 》Assembly Language Example.ppt
- 西安理工大学《微机原理及应用A 》32位微机原理与接口技术学生实验指导书.pdf
- 西安理工大学《微机原理及应用A 》chapt_06 Conditional Processing.ppt
- 西安理工大学《微机原理及应用A 》chapt_08 Advanced Procedures.ppt
- 西安理工大学《微机原理及应用A 》CH5 Interace.ppt
- 西安理工大学《微机原理及应用A 》Computational Thinking.pdf
文档评论(0)