- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]计算机系统结构第3章
第3章 流水和指令级高度并行的超级机 按处理的级别 部件级流水线 指由部件内各子部件组成的流水线 例如由指令分析部件的译码、地址形成、取操作数等子部件组成指令分析部件流水线 浮点加/减运算部件流水线可以由求阶差、对阶、尾数加/减、规格化等子部件组成部件流水线,又称为运算操作流水线 处理机级流水线 处理机内的各部件之间的流水线 例如,由取指部件、指令分析部件和指令执行 部件组成的指令流水线 系统级流水线(宏流水线) 处理机之间的流水线 按机器的数据表示 标量流水处理机 只有流水线,没有向量数据表示和相应的向量指令 处理向量时,采用流水执行方式对向量各元素(标量数据)按标量指令的要求进行处理 向量流水处理机 机器有向量数据表示,设置有向量指令和向量运算硬件 一个向量指令序列可以在向量流水处理机上流水地执行 是向量数据表示和向量指令流水线的结合 相关的类型及其处理 转移指令的处理 标量处理机中的条件转移概率可达10%~30% 主存空间数相关的处理 主存空间数相关 是指相邻两条指令之间出现对主存同一单元要求先写而后读的关联 通用寄存器组相关的处理 操作数的相关 解决方案 推后“分析k+1”的读到“执行k”结束时开始 推后到“执行k”把结果送入L3,然后再由“分析k+1”在取(L1)或(L2)时能取到即可,速度损失减小,但控制较复杂 相关专用通路 内部数据定向 内部数据定向的原则:是要消除一些不必要的访存储器或访寄存器的中间环节,从而减少资源和数据的相关性,以提高流水线的吞吐率。 数据定向分成:写-读定向、读-读定向、写-写定向。 先写后读定向 先读后读定向 先写后写定向 寄存器基址值或变址值相关的处理 解决方案 推后分析 相关专用通路 标量处理机的相关处理和控制机构 造成流水线断流的原因 编译形成的目标程序不能发挥流水结构的作用 存储系统供不上为连续流动所需的指令和操作数 相关和中断 局部相关 对程序执行过程的影响较小,仅涉及到相关指令前后的一条或几条指令的执行 全局相关 影响整个程序执行方向的相关,主要是转移指令和中断引起的相关 顺序流动的”先写后读”相关及处理 顺序流动是指对象从流水线流出的次序同它们进入流水线的次序一样 异步流动的局部相关 异步流动是指对象从流水线流出的次序同它们进入流水线的次序不一样 如果指令j以后的指令与进入流水线的全部指令之间都没有相关问题,那么完全可以仅使相关的 指令j暂停流动,而其后的指令依次越过指令j继续向前流动 采用异步流动可以提高流水线的吞吐率和效率 但会出现两种新的相关:“写—写”相关和“先读后写”相关 相关专用通路 在流水线的读段与写段之间增加一条专用的数据通路 指令j的读操作不是从存储单元中去读,而是通过专用通路读取指令h刚送入写段的数据,从而缩短了指令j暂停的时间 检测及处理相关 先看“忙位”是否为1,若为1则表示产生了相关 通过设置保存站以及“站号”字段和在相关后更改站号来推后处理及控制相关直接通路的连接 加法器和乘除法器以异步流动方式工作 总线式分布控制方式 相关的判断是靠分布于各寄存器的“忙位”标志来管理 分散于各流水线的入、出端处设置若干保存站来缓存信息 用站号控制公共数据总线的连接作相关专用通路 一旦发生相关,用更改站号来推后和控制相关专用通路的连接 采用多条流水线 全局相关及其处理 全局相关 由条件转移或程序中断引起的相关 条件转移指令一般要在流经指令流水线的最后一个功能段时,是否转移的条件才能建立 猜测法 在遇到条件转移指令时,为了使流水线不“断流”,通常采用猜测法。 猜测的分支方向是固定的,一般选择转移不成功的方向 每执行一条条件转移指令,一条k段流水线有k-2个功能段由于转移成功而做了无效的工作 当流水线沿猜测方向执行指令i+1, i+2, …, i+k-2时,一定不能破坏通用寄存器和主存中的内容 两种处理方法:一种是对条件对条件转移指令后的几条指令只进行指令译码和读操作数,在转移条件没有形成之 前不执行运算,因此也不写回运算结果 多发射处理机及其性能 指令并行度ILP 在一个时钟周期平均发射的指令条数 多发射 处理机在一个时钟周期可发射多条指令 超标量处理机及其性能计算 超标量处理机 是在单发射处理机的基础上,采用资源重复的途径来发展指令流水线的并行性 超流水处理机及其性能计算 超流水处理机 是在单发射处理机的基础上,采用时间重叠的途径来发展指令流水线的并行性 通过把单发射的指令流水线各功能段进一步细分来提高处理机的指令级并行度 能在一个基本时钟周期内分时发射多条指令 3 1 2 3 4 5 6 8
文档评论(0)