- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 流水线技术3.1 流水线的基本概念3.2 DLX的基本流水线3.3 流水线的相关3.4 异常处理3.5 DLX中多周期操作的处理3.6 MIPS R4000流水线 复习:性能评测 平均CPI? 每类指令的CPIstate diagram gives CPI for each instruction type 每类指令的使用频度 是否可以使 CPI 4.1? 在一条指令执行过程中下图有许多空闲部件 可以让指令重叠执行??? The Big Picture: Where are We Now? The Five Classic Components of a Computer Next Topics: Pipelining by Analogy Pipeline hazards 3.1 流水线的基本概念 洗衣为例 Ann, Brian, Cathy, Dave 每人进行洗衣的动作: wash, dry, and fold washer需要 30 minutes Dryer 需要 40 minutes “Folder” 需要 20 minutes Sequential Laundry 顺序完成这些任务需要 6 hours for 4 loads 如果采用流水作业, 需要多长时间? 流水线作业: 原则尽可能早地让工作开始 流水作业完成四人的洗衣任务只需要 3.5 hours 流水线技术要点 流水线技术并不能提高单个任务的执行效率,它可以提高整个系统的吞吐率 流水线中的瓶颈是最慢的那一段 多个任务同时执行,但使用不同的资源 其潜在的加速比=流水线的级数 流水端所需时间不均衡将降低加速比 流水线存在装入时间和排空时间,使得加速比降低 由于存在相关问题,会导致流水线停顿 3.2 DLX的基本流水线 计算机的流水线 CPU执行大量的指令,指令吞吐率非常重要 DLX 特征 所有指令相同长度 在指令格式中寄存器位于同一位置 只有Loads和Stores可以对存储器操作 DLX数据通路(图3.9 page 83)一种简单实现 基本操作(Step 1 2) Step 1 - IF IR -- Mem[PC] fetch the next instruction from memory NPC -- PC + 4 compute the new PC Step 2 - ID - instruction decode and register fetch step A -- Regs[IR6..10] B -- Regs[IR11..16] 可能读取的寄存器值没有用,但没有关系,译码后如果无用,以后操作就不用 Imm ? ((IR16)16 ## IR16-31 基本操作-Step 3, 执行阶段 根据译码的结果,有四种情况 Memory Reference ALUOutput -- A + (IR16)16 ## IR16..31 effective address SMD -- B data to be written if it is a STORE -- SMD (store mem data) = MDR Register - Register ALU instruction ALUOutput -- A op B Register - Immediate ALU instruction ALUOutput -- A op ((IR16)16 ## IR16..31)) Branch/Jump ALUOutput -- NPC + (IR16)16 ## IR16..31 cond -- A op 0 for conditional branches A’s value is the condition base (= for BEQZ) 在简单的 Load-Store机器中,不存在即需要计算存存储器地址,指令地址,又要进行ALU运算的指令,因此可以将计算有效地址与执行合二为一,在一个周期内 Step 4 Step5 Step 4 MEM - memory access/branch completion memory reference LMD Mem[ALUOutput] if it’s a load; LMD (load memory data) = MDR 或 Mem[ALUOutput] -- SMD branch if (cond) then PC -- ALUOutput else PC -- NPC for Jumps the condition is always true Step 5 WB - write back Reg - R
您可能关注的文档
最近下载
- GCB6.0操作手册.pdf VIP
- 省级优秀课件小学红色文化主题班会《红色交通证》.pptx VIP
- 《车间质量培训》课件.ppt VIP
- 第八届中国(淄博)国际陶瓷博览会ren体彩绘教学幻灯片.ppt VIP
- AP微积分AB 2014年真题 (选择题+问答题) AP Calculus AB 2014 Released Exam and Answers (MCQ+FRQ).pdf VIP
- delem DA61操作手册(中文).pdf VIP
- 新疆叶城县2025年上半年公开招聘辅警试题含答案分析.docx VIP
- 学堂在线 临床中成药应用 综合考试答案.docx VIP
- 离心泵与.ppt VIP
- 《离心泵.ppt VIP
文档评论(0)