- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 方法二:顺序发射,乱序完成 I1: LOAD R1, A ;R1←主存(A)单元 I2: FADD R2, R1 ;R2←(R2)+(R1) R1:RAW I3: FMUL R3, R4 ;R3←(R3)×(R4) I4: FADD R4, R5 ;R4←(R4)+(R5) R4:WAR I5: DEC R6 ;R6←(R6)-1 I6: FMUL R6, R7 ;R6←(R6) ×(R7) R6:RAW,WAW * * 方法三:乱序发射,乱序完成 I1: LOAD R1, A ;R1←主存(A)单元 I2: FADD R2, R1 ;R2←(R2)+(R1) R1:RAW I3: FMUL R3, R4 ;R3←(R3)×(R4) I4: FADD R4, R5 ;R4←(R4)+(R5) R4:WAR I5: DEC R6 ;R6←(R6)-1 I6: FMUL R6, R7 ;R6←(R6) ×(R7) R6:RAW,WAW * * 5.4.4 超标量处理机的性能 单流水线普通标量处理机的并行度记作(1,1) 超标量处理机的并行度记作(m,1) 超流水线处理机的并行度记作(1,n) 超标量超流水线处理机的并行度记作(m,n) N条没有冲突和相关的指令在单流水线上执行时间: 在每时钟周期发射m条指令的超标量处理机上执行时间: 相应的加速比: * * 第五章 标量处理机 5.5 超流水线处理机 5.5.1 指令执行时序 5.5.2 典型处理机结构 5.5.3 超流水线处理机性能 * * 5.5 超流水线处理机 两种定义: 一个周期内能够分时发射多条指令的处理机称为超流水线处理机 指令流水线有8个或更多功能段的流水线处理机称为超流水线处理机 提高处理机性能的不同方法: 超标量处理机是通过增加硬件资源为代价来换取处理机性能的 超流水线处理机则通过各硬件部件充分重叠工作来提高处理机性能 两种不同并行性:超标量处理机采用的是空间并行性超流水线处理机采用的是时间并行性 * * 5.5.1 指令执行时序 每隔1/n个时钟周期发射一条指令,流水线周期为1/n个时钟周期 在超标量处理机中,流水线的有些功能段还可以进一步细分 例如:ID功能段可以再细分为译码、读第一操作数和读第二操作数三个流水段。也有些功能段不能再细分,如WR功能段一般不再细分。因此有超流水线的另外一种定义:有8个或8个以上流水段的处理机称为超流水线处理机 * * IF 时钟周期 指令 I1 I2 I3 ID EX WR 1 2 3 4 5 6 每个时钟周期分时发送3条指令的超流水线 I4 I5 I6 IF ID EX WR I7 I8 I9 IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR * * 5.5.2 典型处理机结构 MIPS R4000处理机每个时钟周期包含两个流水段,是一种很标准的超流水线处理机结构。指令流水线有8个流水段 有两个Cache,指令Cache和数据Cache的容量各8KB,每个时钟周期可以访问Cache两次,因此在一个时钟周期内可以从指令Cache中读出两条指令,从数据Cache中读出或写入两个数据。 主要运算部件有整数部件和浮点部件 * * 指令 Cache MIPS R4000处理机的流水线操作 IF:取第一条指令 IS:取第二条指令RF:读寄存器堆,指令译码EX:执行指令 DF:取第一个数据DS:取第二个数据 TC:数据标志校验;WB:写回结果 指令译码 读寄存器堆 ALU 数据 Cache 标志检验 寄存 器堆 IF IS RF EX DF DS WB TC * * IF 流水线周期 当前CPU周期 IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB 主时钟周期 MIPS R4000正常指令流水线工作时序 * * 如果在LOAD指令之后的两条指令中,任何一条指令要在它的EX流水级使用这个数据,则指令流水线要暂停一个时钟周期 采用顺序发射方式 * * 暂停 IF IS RF EX DF DS TC WB MIPS R4000 LOAD指令引起的暂停 IS RF EX DF DS TC WB RF EX DF DS TC WB EX DF DS TC WB
文档评论(0)