- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构(第八讲)9
计算机系统结构(第八讲) 厦门大学计算机科学系 陆达 2004年12月13日 第五章 标量处理机 5.3.2 超流水线处理机 什么是超流水线处理机? 这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机 超流水线处理机:流水线的级数≥8 超标量处理机:是以增加硬件资源为代价来换取处理机的性能;空间并行性 超流水线处理机:只需增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机的性能;时间并行性 5.3.2.1 指令执行时序 在一个时钟周期内能够发射n条指令,每隔1/n个时钟周期发射一条指令 图5.79:超流水线处理机的指令执行时空图 (每个时钟周期分时发射2条指令) 功能段可以进一步细分: “译码(ID)功能段”=“译码”流水级+“取第一个操作数”流水级+“取第二个操作数”流水级 图5.81:MIPS R4000处理机的流水线操作 8级流水线、每个时钟周期包含两个流水线 图5.82:MIPS R4000正常指令流水线工作时序 一个时钟周期内,流水线执行完成了两条指令 图5.83:LOAD指令引起的流水线暂停 暂停一个时钟周期(两个流水线周期) 5.3.2.3 超流水线处理机性能 在一台指令级并行度为(1,n)的超流水线处理机上,执行N条没有数据相关和控制相关的指令所需要的时间为: T(1,n)=[k+(N-1)/n]*△t n:每个时钟周期分时发射的指令的条数 N:需要执行的指令条数 k:指令流水线的功能段数 k*n:指令流水线的级数 加速比: S(1,n)=T(1,1)/T(1,n)=n*(k+N-1)/(n*k+N-1) S(1,n)max=n 5.3.3 超标量超流水线处理机 超标量处理机:在一个时钟周期内发射多条指令;主要开发空间并行性,依靠多个操作在重复设置的操作部件上同时执行来提高程序的执行速度 超流水线处理机:把一个时钟周期细分为多个流水线周期,每一个时钟周期能够发射并执行完成多条指令;主要开发时间并行性,在同一操作部件上重叠多个操作,通过使用较快时钟周期的深度流水线来加快程序的执行速度 超标量超流水线处理机:超标量处理机+超流水线处理机 5.3.3.1 指令执行时序 图5.84:超标量超流水线处理机的指令执行时空图 在一个时钟周期内要发射指令n次,每次发射指令m条,每个时钟周期共要发射指令m*n条 5.3.3.2 典型处理机结构 DEC公司的Alpha 21064处理机结构(图5.85) 四个部件: (1)、整数执行部件(EBOX) (2)、浮点执行部件(FBOX) (3)、地址部件(ABOX) (4)、中央控制部件(IBOX) 两个Cache: (1)、指令Cache (2)、数据Cache 采用顺序发射乱序完成的方式控制指令流水线 图5.86:Alpha 21064处理机的指令流水线结构 三条指令流水线: (1)、整数操作流水线(7级) (2)、访问存储器流水线(7级) (3)、浮点操作流水线(10级) 每个指令流水线的前四个流水级(IF、SWAP、I0、I1)采用静态流水线 每个指令流水线的后3~6个流水级采用动态流水线 Alpha 21064处理机:每个时钟周期能够发射两条指令;三条指令流水线的平均级数为8级;属于超标量超流水线处理机 5.3.3.3 超标量超流水线处理机性能 在一台指令级并行度为(m,n)的超标量超流水线处理机上,连续执行N条没有资源冲突,没有数据相关和控制相关的指令所需要的时间为: T(m,n)=[k+(N-m)/(m*n)]*△t m:每个时钟周期同时发射指令的条数 n:每个时钟周期分时发射的指令的条数 k:指令流水线的时钟周期 N:需要连续执行的指令的条数 加速比:S(m,n)=T(1,1)/T(m,n)=[m*n*(k+N-1)]/[m*n*k+N-m] S(m,n)max=m*n 图5.87:三种指令级并行处理机的相对性能 横坐标:处理机的设计指令级并行度(m*n) 纵坐标:处理机能够达到的实际指令级并行度 结论: (1)、超标量处理机相对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低; (2)、一般认为m和n都不要超过4; (3)、一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的,这个最大值主要由程序自身的语义来决定,与这个程序运行在那一种处理机上无关。 本章总结 先行控制技术 流水线处理机 超标量处理机、超流水线处理机、超标量超流水线处理机 先行控制技术 缓冲技术:在工作速度不固定的两个
您可能关注的文档
最近下载
- 河南能源集团网络安全攻防知识培训(分享版)(1).pptx
- 2025年党员考试试题及答案.doc VIP
- 湖南公务员考试真题2024.docx VIP
- mPGES-2作为吸入全身麻醉药物异氟醚作用靶点的应用.pdf VIP
- 案例研究-案例研究:设计与方法.pdf VIP
- 2024届高考物理一轮复习热点题型归类训练专题13动力学和能量观点的综合应用(原卷版+解析).docx VIP
- 烟草质量检验竞赛通用知识题库-上(单选、多选题库).docx VIP
- 德育常规工作培训(1).pptx
- OMRON欧姆龙安全产品F3SG-SR PG系列安全光幕 多光束安全传感器F3SG-SR PG 系列 F3SG-□SR□系列安全光幕 用户手册.pdf
- 保险的培训资料1—开拓准客户.ppt VIP
文档评论(0)