浮点乘法逻辑运算的.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浮点乘法逻辑运算的

第一章 基本概念 第二章 指令系统 第三章 存储系统 第四章 输入输出系统 第五章 标量处理机 第六章 向量处理机 第七章 互连网络 第八章 并行处理机 第九章 多处理机;标量处理机;本章主要内容; 5.1先行控制技术;指令的重叠执行方式;指令的重叠执行方式;指令的重叠执行方式;先行控制方式的原理;(2)两个独立的存储器 独立的指令存储器和数据存储器 解决取指令和读操作数的冲突 如果再规定,执行指令所需要的操作数和执行结果只写到通用寄存器,而不是主存。则取指令、分析指令和执行指令就可以同时进行 在许多高性能处理机中,有独立的指令Cache和数据Cache。这种结构被称为哈佛结构 指令存储器和数据存储器分开的明显缺点:对程序员不透明 (3)采用先行控制技术 先行控制技术的关键是缓冲技术和预处理技术 缓冲技术是在工作速度不固定的两个功能部件之间??置缓冲栈,用以平滑它们的工作 在采用了缓冲技术和预处理技术之后,运算器能够专心于数据的运算,从而大幅度提高程序的执行速度;先行控制方式的处理机结构;3、先行指令缓冲栈的组成 只要指令缓冲栈没有充满,就自动发出取指令的请求。 设置两个程序计数器: 先行程序计数器PC1,用来指示取指令, 现行程序计数器PC,记录指令分析器正在分析的指令地址;4、存在的主要问题 各类指令“分析”和“执行”所需的时间相差很大 存在数据相关 转移指令或转子程序指令 在本章的以下各节中,将分别介绍这三个问题的解决方法 ;先行控制方式的指令执行时序;2、采用先行缓冲栈的指令执行过程 先行读数栈 先行操作栈 后行写数栈;3、指令执行过程的时空图表示方法 理想情况下,指令执行部件应该一直忙碌 连续执行n条指令的时间为:;先行缓冲栈;2、先行操作栈 位置:指令分析器和运算控制器之间 作用:使指令分析器和运算器能够各自独立工作 采用先进先出方式工作,由指令寄存器堆和控制逻辑组成 3、先行读数栈 位置:主存储器与运算器之间 作用:平滑运算器与主存储器的工作 每个缓冲寄存器由地址寄存器、操作数寄存器和标志三部分组成。也可以把地址寄存器和操作数寄存器合为一个 当收到从指令分析器中送来的有效地址时,就向主存申请读操作数 读出的操作数存放在操作数寄存器中或覆盖掉地址寄存器中的地址;4、后行写数栈 每个后行缓冲寄存器由地址寄存器、数据寄存器和标志三部分组成。 指令分析器遇到向主存写结果的指令,把形成的有效地址送入后行写数栈的地址寄存器中,并用该地址寄存器的编号替换指令的目的地址部分,形成RR*指令送入先行操作栈。 当运算器执行这条RR*型写数指令时,只要把写到主存的数据送到后行写数栈的数据寄存器中即可;5、采用先行控制方式时,一个程序的执行情况:; 6、先行缓冲栈访问主存的优先级: 后行写数栈 先行读数栈 先行指令缓冲栈 7、其余缓冲栈的设计原则 各个缓冲栈的缓冲深度一般有如下关系: DI≥DC≥DR≥DW 其中:DI是先行指令缓冲栈的缓冲深度 DC是先行操作栈的缓冲深度 DR是先行读数栈的缓冲深度 DW是后行写数栈的缓冲深度 例如:IBM370/165机:DI=4,DC=3,DR=2,DW=1 我国研制的两台大型计算机: DI=8,DC=DR=4,DW=2 DI=12,DC=DR=6,DW=2;相关性;数据相关性;指令相关;主存操作数相关;通用寄存器相关;通用寄存器相关(续);变址相关;数据相关;控制相关;无条件转移引起的相关;一般条件转移引起的相关;复合条件转移引起的相关;转移预测技术;5.2 流水线技术; 洗衣店的例子; 洗4 个人的衣物,顺序操作需要 8 个小时;流水线作业;30;流水线工作原理;流水线工作原理;一个浮点加法器流水线的时空图 由求阶差、对阶、尾数加和规格化4个流水段组成;4、流水线的主要特点 只有连续提供同类任务才能充分发挥流水线的效率 对于指令流水线:要尽量减少因条件分支造成的“断流” 对于操作部件:主要通过编译技术,尽量提供连续的相同类型的操作。 在流水线的每一个流水线段中都要设置一个流水锁存器。 时间开销:流水线的执行时间加长, 是流水线中需要增加的主要硬件之一。 各流水段的时间应尽量相等 流水线处理机的基本时钟周期等于时间最长的流水段的时间长度 流水线需要有“装入时间”和“排空时间” Latency throughput? ;流水线技术在50年代后期被应用于处理器 IBM Stretch----first general-purpose pipelined computer CDC 6600 use load/st

文档评论(0)

ayangjiayu4 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档