第3章 流水技术与流水处理机.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

S61234567891011S5123456S4123456S37891011S27891011S11234567891011t(Δt)图3.19例3.8的时空图第93页,共149页,星期日,2025年,2月5日由时空图可得实际吞吐率、加速比和效率分别为第94页,共149页,星期日,2025年,2月5日3.6多发射处理机及其性能单发射是指处理机在一个时钟周期()只从存储器取出一条指令(IF)、只对一条指令译码(ID)、只执行一条指令(EX)和只写回一个运算结果(WR),因此,平均一个时钟周期只解释一条指令。单发射处理机的指令级并行度ILP1。多发射是指处理机在一个时钟周期可发射多条指令。多发射处理机的指令级并行度ILP≥2。属于多发射处理机范畴的处理机有:超标量处理机、超流水处理机、超标量超流水处理机和超长指令字处理机。第95页,共149页,星期日,2025年,2月5日3.6.1超标量处理机及其性能计算超标量处理机是在单发射处理机的基础上,采用资源重复的途径来发展指令流水线的并行性,通过重复设置硬件资源来提高处理机的指令级并行度。1.超标量处理机指令流水线的结构第96页,共149页,星期日,2025年,2月5日取指令指令译码执行指令写回结果FA1FA2FA3MD1MD2MD3IFIDALWRLS定点算术逻辑部件乘除法部件来自指令Cache浮点加法部件通用寄存器或后行写数栈取数存数部件(a)单发射处理机指令流水线第97页,共149页,星期日,2025年,2月5日取指令指令译码执行指令写回结果FA1FA2FA3MD1MD2MD3IF1ALWR1LS定点算术逻辑部件乘除法部件来自指令Cache浮点加法部件通用寄存器或后行写数栈取数存数部件IF2ID2来自指令CacheIF3先行指令窗口WR2通用寄存器或后行写数栈ID3ID1(b)超标量处理机指令流水线FA:浮点加减法运算MD:乘除法运算AL:定点算术逻辑运算LS:取数存数第98页,共149页,星期日,2025年,2月5日多发射是指处理机在一个时钟周期同时发射多条指令。上图是一个同时发射3条指令的多发射处理机的指令执行时空图。第99页,共149页,星期日,2025年,2月5日先行指令窗口的大小对超标量处理机的性能影响很大,窗口太小,调度的效果不好;窗口太大,调度所需的硬件太复杂。目前,多数超标量处理机的先行指令窗口大小为2~8条指令。对大量程序的统计分析表明,每个时钟周期发射2~4条指令比较合理。例如,Intel公司的i860、i960、Pentium处理器,Motolora公司的MC88110处理器,IBM公司的Power6000处理器等都是每个时钟周期发射两条指令。如果一台超标量处理机每个时钟周期发射m条指令,则它的指令级并行度ILP的期望值就为m。但是,由于相关和资源冲突等原因,实际的ILP为:1ILPm。第100页,共149页,星期日,2025年,2月5日2.超标量处理机性能如果一台超标量处理机每个时钟周期发射m条指令,则它的指令级并行度ILP的期望值为m。在理想情况下,N条没有相关和段资源冲突的指令在单发射处理机上的执行时间为其中,k是流水线的段数,是一个时钟周期的时间长度。第101页,共149页,星期日,2025年,2月5日如果把上述同样的N条指令在一台每个时钟周期发射m条指令的超标量处理机上执行,则所需要的时间为第102页,共149页,星期日,2

文档评论(0)

xiaoshun2024 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档