第三节流水线技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科学技术大学 第三章 流水线技术 3.1 流水线的基本概念 3.2 DLX的基本流水线 3.3 流水线的相关 3.4 异常处理 3.5 DLX中多周期操作的处理 3.6 MIPS R4000流水线 Review:性能评测 平均CPI? 每类指令的使用频度 是否可以使 CPI 4.1? 在一条指令执行过程中下图有许多空闲部件 可以让指令重叠执行?? 3.1 流水线的基本概念 洗衣为例 Ann, Brian, Cathy, Dave 每人进行洗衣的动作: wash, dry, and fold washer需要 30 minutes Dryer 需要 40 minutes “Folder” 需要 20 minutes Sequential Laundry 顺序完成这些任务需要 6 小时 如果采用流水作业, 需要多长时间? 流水线作业: 尽可能让任务重叠进行 流水作业完成四人的洗衣任务只需要 3.5 hours 流水线技术要点 流水线技术并不能提高单个任务的执行效率,它可以提高整个系统的吞吐率 流水线中的瓶颈——最慢的那一段 多个任务同时执行,但使用不同的资源 其潜在的加速比=流水线的级数 流水段所需时间不均衡将降低加速比 流水线存在装入时间和排空时间,使得加速比降低 由于存在相关问题,会导致流水线停顿 3.2 DLX的基本流水线 指令流水线:CPU执行大量的指令,指令吞吐率非常重要 DLX 的指令格式 DLX数据通路一种简单实现 基本操作(Step 1 2) Step 1 - IF IR -- Mem[PC] fetch the next instruction from memory NPC -- PC + 4 compute the new PC Step 2 - ID - instruction decode and register fetch step A -- Regs[IR6..10] B -- Regs[IR11..16] 可能读取的寄存器值没有用,但没有关系,译码后如果无用,以后操作就不用 Imm ? ((IR16)16 ## IR16-31 基本操作-Step 3, 执行阶段 根据译码的结果,有四种情况 Memory Reference ALUOutput -- A + (IR16)16 ## IR16..31 effective address SMD -- B data to be written if it is a STORE -- SMD (store mem data) = MDR Register - Register ALU instruction ALUOutput -- A op B Register - Immediate ALU instruction ALUOutput -- A op ((IR16)16 ## IR16..31)) Branch/Jump ALUOutput -- NPC + (IR16)16 ## IR16..31 cond -- A op 0 for conditional branches A’s value is the condition base (= for BEQZ) 在简单的 Load-Store机器中,不存在即需要计算存储器地址,指令地址,又要进行ALU运算的指令,因此可以将计算有效地址与执行合二为一,在一个流水段中进行。 Step 4 Step5 Step 4 MEM - memory access/branch completion memory reference LMD Mem[ALUOutput] if it’s a load; LMD (load memory data) = MDR 或 Mem[ALUOutput] -- SMD branch if (cond) then PC -- ALUOutput else PC -- NPC for Jumps the condition is always true Step 5 WB - write back Reg - Reg ALU Regs[IR16..20] -- ALUOutput Reg - Immed ALU Regs[IR11..15] -- ALUOutput Load Regs[IR11..15] -- LMD 这种结构是否可行 模型是正确的,但没有优化 还有其他选择 指令和数据存储器是否可以分开 采用一个长周期还是5个短周期实现 单周期和多周期控制 多周期控制可实现指令重叠执行 DLX的基本流水线 假设流水线周期为每步所花费的时间 为什么用流水线? 假设执行100条指令 单周期机器

文档评论(0)

aa15090828118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档