第五章流水和指令级高度并行超级机.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 流水和指令级高度并行的超级机 加速机器语言解释的两种方式 通过选用更高速的器件,采用更好的运算方法、提高指令内各微操作的并行程度,减少解释过程所需要的拍数,以加快每条指令的解释。 通过控制机构采用同时解释两条、多条以至整段程序的控制方式,加快整个机器语言程序的解释。 重叠、流水。 What Is Pipelining Laundry(洗衣) Example Ann, Brian, Cathy, Dave each have one load of clothes to wash, dry, and fold Washer takes 30 minutes Dryer takes 40 minutes “Folder” takes 20 minutes What Is Pipelining Sequential laundry takes 6 hours for 4 loads If they learned pipelining, how long would laundry take? What Is Pipelining Start work ASAP Pipelined laundry takes 3.5 hours for 4 loads Pipelining Lessons Pipelining doesn’t help latency of single task, it helps throughput of entire workload Pipeline rate limited by slowest pipeline stage Multiple tasks operating simultaneously Potential speedup = Number pipe stages Unbalanced lengths of pipe stages reduces speedup Time to “fill” pipeline and time to “drain(排出)” it reduces speedup 目录 重叠方式 流水方式 向量的流水处理与向量流水处理机 指令级高度并行的超级处理机 §1 重叠方式 基本思想和一次重叠 相关处理 顺序解释与重叠解释 一次重叠的工作方式 基本思想和一次重叠 顺序解释:各条机器指令之间顺序串行地执行,执行完一条指令后采取出下条指令来执行,而且每条指令内部的各个微操作也是顺序串行地执行。 优点:控制简单。 重叠解释:在解释第k条指令的操作完成之前,就可开始解释第k+1条指令 不能加快一条指令的实现 但能加快相邻两条以至一段程序的解释 时间重叠,解决访存冲突 操作数和指令分存于两个独立编址且可同时访问的存储器,有利于实现指令保护,增加总线控制和软件设计的复杂性 混存,采用多体交叉主存结构 增设指令缓冲寄存器 解决访存冲突(续) 在硬件上,保证又独立的指令分析部件和指令执行部件; 两部分执行的时间常常不相同,在硬件上解决好控制上的同步; 控制上的其他问题 指令转移,下图 相关问题 数相关:第k、k+1条指令的数据地址之间有了关联。 数相关不仅发生在主存空间,还会发生在通用寄存器空间 指令相关:采用Von Neumann型机器上指令可修改的办法经第k条指令的执行来形成第k+1条指令 指令相关的处理 原因:Von Neumann型机器的指令允许修改。 解决:在程序执行过程中,不准修改指令,除可解决指令相关,也可实现程序的可再入性和程序的递归调用。 主存空间数相关的处理 相邻两条指令之间要求对主存同一单元线写入而后再读出的关联。 解决:延迟。 通用寄存器数相关处理 延迟和设置“相关专用通路”是解决重叠方式相关处理的两种基本方法。 前者设备不变,降低速度; 后者增加设备,效率不变。 举例 假设指令:操作码 L1 L3 B2 d2 L1,L3分别指明存放第一操作数和结果数的通用寄存器号 B2为形成第二操作数地址的基址值所在的通用寄存器号 D2为相对位移量 指令解释过程中与通用寄存器 内容有关的微操作时间关系 “执行”、“分析”重叠时,访问通用寄存器组的时间关系 当程序执行过程中出现L1(k+1)=L3(k),就发生L1相关; 而当L2(k+1)=L3(k),就发生L2相关; 解决: 退后,延迟 设备不增加,速度降低,适合于相关概率低 设置“相关专用通路” 增加设备,效率不会明显下降,适合于相关概率高 用相关专用通路解决 通用寄存器组的数相关 顺序执行方式 执行n条指令所用的时间为: 如每段时间都为t,则执行n条指令所用的时间为:T=3nt 主要优点:控制简单,节省设备 主要缺点:执行

文档评论(0)

aa15090828118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档