- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浮点乘法逻辑运算的
第一章 基本概念
第二章 指令系统
第三章 存储系统
第四章 输入输出系统
第五章 标量处理机
第六章 向量处理机
第七章 互连网络
第八章 并行处理机
第九章 多处理机;标量处理机;本章主要内容; 5.1先行控制技术;指令的重叠执行方式;指令的重叠执行方式;指令的重叠执行方式;先行控制方式的原理;(2)两个独立的存储器
独立的指令存储器和数据存储器
解决取指令和读操作数的冲突
如果再规定,执行指令所需要的操作数和执行结果只写到通用寄存器,而不是主存。则取指令、分析指令和执行指令就可以同时进行
在许多高性能处理机中,有独立的指令Cache和数据Cache。这种结构被称为哈佛结构
指令存储器和数据存储器分开的明显缺点:对程序员不透明
(3)采用先行控制技术
先行控制技术的关键是缓冲技术和预处理技术
缓冲技术是在工作速度不固定的两个功能部件之间??置缓冲栈,用以平滑它们的工作
在采用了缓冲技术和预处理技术之后,运算器能够专心于数据的运算,从而大幅度提高程序的执行速度;先行控制方式的处理机结构;3、先行指令缓冲栈的组成
只要指令缓冲栈没有充满,就自动发出取指令的请求。
设置两个程序计数器:
先行程序计数器PC1,用来指示取指令,
现行程序计数器PC,记录指令分析器正在分析的指令地址;4、存在的主要问题
各类指令“分析”和“执行”所需的时间相差很大
存在数据相关
转移指令或转子程序指令
在本章的以下各节中,将分别介绍这三个问题的解决方法
;先行控制方式的指令执行时序;2、采用先行缓冲栈的指令执行过程
先行读数栈
先行操作栈
后行写数栈;3、指令执行过程的时空图表示方法
理想情况下,指令执行部件应该一直忙碌
连续执行n条指令的时间为:;先行缓冲栈;2、先行操作栈
位置:指令分析器和运算控制器之间
作用:使指令分析器和运算器能够各自独立工作
采用先进先出方式工作,由指令寄存器堆和控制逻辑组成
3、先行读数栈
位置:主存储器与运算器之间
作用:平滑运算器与主存储器的工作
每个缓冲寄存器由地址寄存器、操作数寄存器和标志三部分组成。也可以把地址寄存器和操作数寄存器合为一个
当收到从指令分析器中送来的有效地址时,就向主存申请读操作数
读出的操作数存放在操作数寄存器中或覆盖掉地址寄存器中的地址;4、后行写数栈
每个后行缓冲寄存器由地址寄存器、数据寄存器和标志三部分组成。
指令分析器遇到向主存写结果的指令,把形成的有效地址送入后行写数栈的地址寄存器中,并用该地址寄存器的编号替换指令的目的地址部分,形成RR*指令送入先行操作栈。
当运算器执行这条RR*型写数指令时,只要把写到主存的数据送到后行写数栈的数据寄存器中即可;5、采用先行控制方式时,一个程序的执行情况:;
6、先行缓冲栈访问主存的优先级:
后行写数栈 先行读数栈 先行指令缓冲栈
7、其余缓冲栈的设计原则
各个缓冲栈的缓冲深度一般有如下关系:
DI≥DC≥DR≥DW
其中:DI是先行指令缓冲栈的缓冲深度
DC是先行操作栈的缓冲深度
DR是先行读数栈的缓冲深度
DW是后行写数栈的缓冲深度
例如:IBM370/165机:DI=4,DC=3,DR=2,DW=1
我国研制的两台大型计算机:
DI=8,DC=DR=4,DW=2
DI=12,DC=DR=6,DW=2;相关性;数据相关性;指令相关;主存操作数相关;通用寄存器相关;通用寄存器相关(续);变址相关;数据相关;控制相关;无条件转移引起的相关;一般条件转移引起的相关;复合条件转移引起的相关;转移预测技术;5.2 流水线技术; 洗衣店的例子; 洗4 个人的衣物,顺序操作需要 8 个小时;流水线作业;30;流水线工作原理;流水线工作原理;一个浮点加法器流水线的时空图
由求阶差、对阶、尾数加和规格化4个流水段组成;4、流水线的主要特点
只有连续提供同类任务才能充分发挥流水线的效率
对于指令流水线:要尽量减少因条件分支造成的“断流”
对于操作部件:主要通过编译技术,尽量提供连续的相同类型的操作。
在流水线的每一个流水线段中都要设置一个流水锁存器。
时间开销:流水线的执行时间加长,
是流水线中需要增加的主要硬件之一。
各流水段的时间应尽量相等
流水线处理机的基本时钟周期等于时间最长的流水段的时间长度
流水线需要有“装入时间”和“排空时间”
Latency throughput? ;流水线技术在50年代后期被应用于处理器
IBM Stretch----first general-purpose pipelined computer
CDC 6600 use load/st
您可能关注的文档
- 江苏省2016年普通高的校对口单招文化统考计算机应用专业综合理论试卷.pdf
- 江苏省专转本计算机的十分计算题.ppt
- 江苏省仪征市谢集中的学2011-2012学年八年级物理下学期 《从粒子到宇宙》同步练习(无答案) 人教新课标版.doc
- 江苏省盐城市建湖县的2013-2014学年七年级下学期期中考试语文试题.doc
- 江苏省南通市2011届的高三第二次调研测试语文试题.pdf
- 江苏省计算机一级模的拟练习题(三).doc
- 江苏省邳州市第二中的学2013年高中化学必修一课件:第一课时 物质的分离与提纯.ppt
- 江苏省高三一轮数学的复习专题材料 推理与证明.doc
- 江苏省靖江市2008—的2009学年度第一学期调研测试高三历史试题.doc
- 江苏省高级职称计算的机考试题库(含答案).doc
文档评论(0)