- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章指令流水技术
第五章 指令流水技术 5.1 指令流水的基本概念 流水工作方式:将一个计算任务细分成若干个子任务,每个子任务由专门的部件处理,多个计算任务依次进行并行处理。 流水线的性能 1. 吞吐率: 单位时间内流水线能处理的任务数量。 最大吞吐率与实际吞吐率 2. 加速比 流水方式的工作速度与等效的顺序工作方式时间的比值 5.1.1 基本指令流水线 流水方式与非流水方式的比较 例 假定将CPU分成上述5个阶段,存储器访问需要2ns时间,寄存器操作需要1ns,ALU运算时间为2ns,求流水方式和非流水方式下执行以下4条指令所需的时间。 lw $1,100($2) sw $4,100($5) add $7,$8,$9 beq $10,$11,3000 答: 在非流水的情况下,每个步骤所需的时间: 在流水的情况下,流水周期定为2ns,指令执行时间为10个周期。 指令流水线的时空图 指令的流水执行的要求 1. 指令长度应当尽量相同。 2. 指令格式应当简单。 3. 限制访存操作。 4. 尽量使操作数在存储器中对齐存储。 5.1.2 指令的相关性 1. 资源相关(结构相关) 流水执行的多条指令同时使用同一个部件 2. 数据相关 流水执行的多条指令访问相同的数据 RAW、WAR、WAW 3. 控制相关。 转移指令引起的相关 1. 指令流水线的数据相关 消除数据相关影响的方法 停顿 编译检测 相关专用通路 解决数据相关性的方法——流水线的停顿 消除数据相关性影响方法——编译的方法。 解决数据相关性的方法 ——相关专用通道 解决数据相关性的方法——相关专用通道 2. 指令流水线的控制相关 改进转移指令执行性能的方式——将转移指令的执行在流水线中提前进行 3. 指令流水线的资源相关 5.2 指令的调度 指令级并行性:指令序列中的并行性。 基本块:一个直线指令序列,除了程序的入口外不含其他转入的分支,除了出口处外不含其他转出的分支。 循环级并行性:循环递归之间的并行性。 开发循环级并行性的方法:循环展开,指令调度 例:for (i=1; i=1000; i=i+1) x[i] = x[i] + s; 编译后变成:loop: LD F0, 0(R1); F0=array element ADDD F4,F0,F2; add scalar in F2 SD 0(R1),F4; store result SUBI R1,R1,8; decrement pointer 8 bytes BNEZ R1,loop; branch if R1!=zero 执行时的情况 假定LD指令的执行需2拍,ADDD执行需3拍,有一个转移延迟槽。 loop: LD F0, 0(R1) 1 stall 2 ADDD F4,F0,F2 3 stall 4 stall 5 SD 0(R1),F4 6 SUBI R1,R1,8 7 BNEZ R1,loop 8 stall 9 指令调度后的执行情况 loop: LD F0, 0(R1) stall ADDD F4,F0,F2 SUBI R1,R1,8 BNEZ R1,loop SD 8(R1),F4 执行时间:6个时钟周期。 程序展开3次 loop: LD F0, 0(R1) 2 ADDD F4,F0,F2 3 SD 0(R1),F4 1 LD F6,-8(R1) 2 ADDD F8,F6,F2 3 SD -8(R1),F8 1 LD F10,-16(R1) 2 ADDD F12,F10,F2 3 SD -16(R1),F12 1 LD F14,-24(R1) 2 ADDD F16,F14,F2 3 SD -24(R1),F16 1 SUBI R1,R1,#32 1 BNEZ R1,loop 2 未调度时,执行时间为27个周期,平均每个迭代6.8个周期 调度后 loop: LD F0, 0(R1) LD F6,-8(R1) LD F10,-16(R1) LD F14,-24(R1) ADDD F4,F0,F2 ADDD F8,F6,F2 ADDD F12,F10,F2 ADDD F16,F14,F2 SD 0(R1),F4 SD -8(R1),F8 SD -16(R1),F12 SUBI R1,R1,#32 BNEZ R1,loop SD
您可能关注的文档
- 达州市2016届普通高中第一次诊断性检测.doc
- 答案一、综合填空q1q2q3q4q5q6112334二、改正错别字q7.doc
- 达到并维持哮喘控制.ppt
- 答司马谏议书王安石一、课标分解1、借助工具书和有关资料,读懂不太.doc
- 大額通貨交易檔案格式(filelayout)-回上頁.doc
- 大鼠甲1型流感病毒酶联免疫分析.doc
- 大型普通客车.doc
- 大学生对恋爱问题的看法.ppt.ppt
- 大学生就业指导课课件1点击下载.ppt
- 大学生幸福度08科教.ppt
- 2025安徽合肥长丰县部分国有企业招聘工作人员12人历年真题汇编附答案解析.docx
- 2025广西防城港市“三支一扶”招募42人备考题库及答案详解(典优).docx
- 2025年甘肃省甘南州各县市三支一扶选拔指标备考题库(137人)及完整答案详解1套.docx
- 2025广东茂名市公安局茂南分局招聘警务辅助人员30人备考题库及答案详解1套.docx
- 2025广西壮族自治区生殖医院招聘工作人员13人备考题库附答案详解(考试直接用).docx
- 2025年西安铁路局集团有限公司招聘1580人备考题库及答案详解(全优).docx
- 2025广东韶关市翁源县教育教学类青年人才暨“急需紧缺”专业人才招聘20人备考题库有答案详解.docx
- 2025年甘肃省选调应届优秀大学毕业生650人备考题库及答案详解(夺冠系列).docx
- 2025广西南宁市农业农村局招聘外聘人员1人备考题库及答案详解(全优).docx
- 2025广东湛江海关所属事业单位招聘事业编制人员15人备考题库及答案详解(全国通用).docx
原创力文档


文档评论(0)