计算机系统结构new.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机系统结构new.ppt

操作部件采用流水线: 做完4条指令共用8个周期, 少用3个周期。 操作部件采用流水线结构的原因分析 假每个周期发射m条指令,操作部件的延迟时间为k个周期, 如果操作部件不采用流水线结构,则使用同一个操作部件的两条指令应该至少相差m×k 如果操作部件采用k段流水线结构,则使用同一个操作部件的两条指令只需相差m或m以上 指令流水线的段数k一般在4至10之间,每个时钟周期发射的指令条数m在2至4之间。取中间值,k=7,m=3 为了不发生资源冲突,如果操作部件不采用流水线结构, 两条使用同一个功能部件的指令序号必须相差21或21以上。 如果操作部件采用流水线结构, 两条使用同一个功能部件的指令序号只需要相差3或3以上。 因此,在超标量处理机中,操作部件一般要采用流水线结构。 如果由于某种原因,操作部件不能采用流水线结构,则必须设置多个相同种类的操作部件 普通标量处理机,希望相同操作连续出现。 只有连续出现相同操作的指令序列时,流水线的效率才能得到充分发挥。 超标量处理机则正好相反,希望相同操作不要连续出现。 相同操作的指令序列连续出现时,会发生资源冲突; 要求相同操作的指令能够相对均匀地分布在程序中。 超标量处理机的这种要求正好符合一般标量程序的特点。 5.5.5 超标量处理机性能 单流水线普通标量处理机的指令级并行度记作(1, 1), 超标量处理机的指令级并行度记作(m, 1), 超流水线处理机的指令级并行度记作(1, n), 而超标量超流水线处理机的指令级并行度记作(m, n)。 在理想情况下,N条指令在单流水线标量处理机上的执行时间为: T(1, 1)=(k+N-1)?t 在每个周期发射m条指令的超标量处理机上执行的时间为: 超标量处理机相对于单流水线标量处理机的加速比为: 超标量处理机的加速比的最大值为:S(m,1)MAX=m 5.6 超流水线处理机 5.6.1 指令执行时序 5.6.2 典型处理机结构 5.6.3 超流水线处理机性能 超流水线处理机的两种定义: 在一个周期内分时发射多条指令的处理机 指令流水线的段数大于等于8的流水线处理机 提高处理机性能的两种方法: 通过增加硬件资源来提高处理机性能 通过各部分硬件的重叠工作来提高处理机性能 两种不同并行性: 超标量处理机采用的是空间并行性。 超流水线处理机采用的是时间并行性。 5.6.1 指令执行时序 每隔1/n个时钟周期发射一条指令, 即处理机的流水线周期为1/n个时钟周期。 5.6.2 典型处理机结构 MIPS R4000处理机: 每个时钟周期包含两个流水段 是一种很标准的超流水线处理机结构。 指令流水线有8个流水段。 指令Cache和数据Cache的容量各8KB, 每个时钟周期可以访问Cache两次, 在一个时钟周期内可以从指令Cache中读出两条指令,从数据Cache中读出或写入两个数据。 主要运算部件有整数部件和浮点部件。 如果在LOAD指令之后的两条指令中,任何一条指令要在它的EX流水级使用这个数据,则指令流水线要暂停一个时钟周期。 5.6.3 超流水线处理机性能 指令级并行度为(1,n)的超流水线处理机,执行N条指令所的时间为: 超流水线处理机相对于单流水线普通标量处理机的加速比为: 加速比的最大值为:S(1, n)MAX=n 5.7 超标量超流水线处理机 一个时钟周期发射m次,每次发射n条指令 5.7.1 指令执行时序 5.7.2 典型处理机结构 5.7.3 超标量超流水线处理机性能 5.7.4 三种处理机的性能比较 5.7.1 指令执行时序 5.7.2 典型处理机结构 DEC公司的Alpha处理机为典型的超标量超流水线结构。 主要由四个功能部件和两个Cache组成:整数部件EBOX 浮点部件FBOX 地址部件ABOX 中央控制部件IBOX 指令Cache和数据Cache 在EBOX内还有多条专用数据通路,可以把运算结果直接送到执行部件。 中央控制部件IBOX能够同时完成: 同时读出两条指令; 同时对两条指令进行译码,并作相关性检测; 如果资源和相关性允许,IBOX就把两条指令同时发射给EBOX、ABOX和FBOX三个执行部件中的两个。 指令流水线的控制方式: 采用顺序发射乱序完成。 在指令Cache中有一个转移历史表,实现条件转移的动态预测。 Alpha 21064处理机共有三条指令流水线: (1)整数操作流水线为7个流水段,其中,取指令2个流水段、分析指令2个流水段、运算2个流水段、写结果1个流水段。 (2)访问存储器流水线为7个流水段。 (3)浮点操作流水线分为10个流水段,其中,浮点执行部

文档评论(0)

cai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档