- 1、本文档共164页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
设计处理机的主要目标之一是提高处理机指令执行速度,通常有三条途径: ①提高CPU工作主频,目前依靠提高集成度来提高半导体器件主频几乎达到极限; ②采用更好的算法和功能部件。例如采用RISC,改进乘法、除法的算法等; ③采用指令并行技术,这是目前提高处理机性能的主要方法,其基本方法有3个,即流水线技术;超标量超流水线技术以及超长指令字技术。 只有标量数据表达式和标量指令系统的处理机叫标量处理机, 具有向量数据表达式和向量指令系统的处理机叫向量处理机。 在标量处理机和向量处理机中广泛采用了流水线技术。 本章先以标量处理为基础介绍流水线技术原理和性能分析,以及实现中要解决的问题和方法,进而讲述先进的流水技术和向量处理机、向量流水线结构。 设一条指令的执行过程分为:取指(取指令)、析指(分析指令)、执指(执行指令)三个阶段 三个阶段都可能有访存操作 1. 顺序执行方式: n条指令的执行时间: 设每段时间相等都是t,则执行时间: T=3nt 特点:简单,但指令执行速度慢,功能部件利用率低 2. 一次重叠执行方式 T=(1+2n)t≈2nt 当n很大时,约缩短了1/2时间 3. 二次重叠执行方式 T=(2+n)t≈nt 当n很大时,约缩短了2/3时间 指令的重叠执行对计算机组成提出什么要求 首先,需要把顺序执行方式中的一个集中的指令控制器,分解成三个功能独立的部件:存控(存储控制器)、指控(指令控制器)、运控(运算控制器) 其次,要解决三个阶段访问主存冲突问题,实现并行访存。有3种解决办法: (1)将主存分为两个独立编址的存储器:指令存储器和数据存储器,CPU可分别独立访问,这样就没有取指和析指访存的冲突。 (2)低位交叉存取方式,可并行访问不在同一个存储体中的指令或数据。 (3)根本解决办法是采用先行控制技术 再次,还要求各个功能部件的运行速度大致相等,避免在重叠中的相互等待,如图5-3所示。这需要用到先行控制技术中的缓冲技术,以及依靠RISC技术的支持。 指令的重叠执行对计算机组成提出什么要求 还有,如果指令K是转移指令,则顺序取来的指令k+1势必无效,重叠运行就会被打断;类似的如数据相关等问题都必须解决。 可见,实现功能部件的多次重叠,使程序运行如同生产流水线一般源源不断地执行指令和得到结果,就需要RISC系统的支持和采用先行控制技术,并解决有关控制转移、数据相关、资源冲突带来的可能使流水线断流的问题 RISC具有指令简单、规整,只有存(STORE)、取(LOAD)指令,几乎所有指令都在一个机器周期内完成,并注重编译的优化等特点,容易做到指令重叠运行时各个功能部件的运行时间相等,大大减少了重叠中功能部件的相互等待,为指令流水带来天然的支持。 此外,为了更好地发挥其在流水线中的效果,RISC处理机还采用了延时转移、指令取消、重叠寄存器窗口、指令流调整、硬件为主固件为辅等多种关键技术。 1. 延时转移技术 遇到转移指令,流水线可能断流。如: 1 ADD R1,R2 2 JMP NEXT2 3 NEXT1: SUB R3,R4 …… n NEXT2: MOVE R4,A 在转移指令后插入一条有效指令,如: 1 JMP NEXT2 2 ADD R1,R2 3 NEXT1: SUB R3,R4 …… n NEXT2: MOVE R4,A 指令序列的调整由编译器自动进行 例: 1: MOVE R1, R2 2: CMP R3, R4 3: BEQ NEXT 4: ADD R4, R5 …… n: NEXT: MOVE R4, A 1: CMP R3, R4 2: BEQ NEXT 3: MOVE R1, R2 4: ADD R4, R5 …… n: NEXT: MOVE R4, A 问题:如果原指令1是 MOV R3, R2 该怎么
文档评论(0)