- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1. 要求: 取指令和解码部件都是64位。 编译结果要求指令按要求组合成对,且与64位边 界对齐,整数指令顺序在前。 只有第一条指令流出后才可以流出第二条指令。 如果第二条指令不满足条件就只流出第一条指令。 2. DLX两路超标量指令流的示意图 指令 整数指令 浮点指令 整数指令 浮点指令 整数指令 浮点指令 整数指令 浮点指令 IF IF ID ID IF IF EX EX ID ID IF IF MEM MEM EX EX ID ID IF IF WB WB MEM MEM EX EX ID ID WB WB MEM MEM EX EX WB WB MEM MEM WB WB 流水线工作情况 图4.16 两路超标量指令执行示意图 3.通过对指令流出部件采用流水技术,可以很大地 提高指令流出的速率,但同时必须采用流水化的 功能部件或多个独立的功能部件。4.并行流出一条整数指令和一条浮点指令,除了一 般的冲突监测机制,只要增加少量的硬件。5.指令相关情况 浮点数据访存指令将使用整数部件,会增 加访存的结构冲突。监测是否存在结构相 关只需检查两条指令的操作码。 浮点寄存器端口的访问冲突: 限制浮点数据存取(访存)指令单独执行。 给每个浮点寄存器设置两个的端口,一个读端口,一条写端口,通过增加资源来消除结构相关。 当指令组合中包含浮点取指令,且后面的浮点指令 与之相关时,硬件必须能够检测出来,从而限制后 面浮点指令的流出。除了这种情况,其它可能存在 的相关检测和单流出流水线是相同的。另外,还需 要添加一些额外的相关专用通路来避免不必要的流 水线空转。 限制超标量流水线的性能发挥的障碍: 取操作指令的结果不能在本周期或下一个周期使用,所以后续三条指令不能使用其结果。 分支延迟也变为三条指令,因为分支指令肯定是指令组合的第一条指令。 例4.9 下面是前面我们使用的循环程序段,在超标 量DLX流水线上将如何调度? Loop: LD F0,0(R1) ;F0=数组元素 ADDD F4,F0,F2 ;加上在F2中的标量 SD 0(R1),F4 ;存结果 SUBI R1,R1,#8 ;将指针减少8(每个DW) BNEZ R1,Loop ;R1不等于0,转移 解:展开并经过调度的指令序列如图4.17所示。 Loop: LD LD LD LD LD SD SD SD SD SUBI BNEZ SD F0(R1) F6,-8(R1) F10,-16(R1) F14,-24(R1) F18,-32(R1) 0(R1),F4 -8(R1),F8 -16(R1),F12 -24(R1),F16 R1,R1,#40 R1,Loop 8(R1),F20 ADDD ADDD ADDD ADDD ADDD F4,F0,F2 F8,F6,F2 F12,F10,F2 F16,F14,F2 F20,F18,F2 1 2 3 4 5 6 7 8 9 10 11 12 整数指令 浮点指令 时钟周期 超标量流水线上展开的代码每次循环需12个时钟周期,即每个迭代是2.4个时钟周期。而在普通的DLX流水线上,没有调度的迭代1次为9个时钟周期,性能提高了3.75倍;调度后为6个时钟周期,性能提高了2.5倍;展开4次并调度后每个迭代为3.5个时钟周期,性能提高了1.4倍。 6.超标量处理器与超长指令字处理器相比有两个 优点: (1)超标量结构对程序员是透明的,因为处理 器能自己检测下一条指令能否流出,从而 不需要排列指令来满足指令流出; (2)即使是没有经过编译器对超标量结构进行 调度优化的代码或是旧的编译器生成的代 码也可以运行,当然运行的效果不会很好。 要想达到很好的效果,方法之一: 使用动态超标量调度技术。 4.4.2 动态多指令流出技术 扩展Tomasulo算法:支持两路超标量。 即每个时钟周期流出两条指令。 (一条是整数指令,另一条是浮点指令) 1.要求 指令按顺序流向保留站,否则信息记录机制 会太复杂。 将整数寄存器和浮点寄存器分开,只要不使 用相同的寄存器就可同时将一条整数指令和 一条浮点指令送到它们的保留站中去。 限制相关指令的并行执行。 2.有两种方式可以实现两路超
您可能关注的文档
- 晋教版七上4.2降水及降水的分布(44张)总汇.ppt
- 2013年高考化学一轮复习(人教版):第三单元-第19讲-盐类的水解开题报告.ppt
- 挤压缺陷鉴别与原因及改善措施培训总汇.ppt
- 恒定电流复习题库.ppt
- 晋教版七下9.4欧洲西部(共57张)总汇.ppt
- 恒坤-焦粉回配炼焦题库.ppt
- 恒流源驱动电路的制作题库.ppt
- 挤压与拉拔新技术总汇.ppt
- 禁毒宣传教育.总汇.ppt
- 2013年中考物理考试开题报告.ppt
- 关于请求易地扶贫搬迁的申请大全.docx
- 国防安全演讲稿.docx
- 教科版二年级上册科学全册新质教学课件(配2025年秋改版教材).pptx
- 部编人教版二年级上册道德与法治全册新质教学课件(配2025年秋改版教材).pptx
- 2023年三亚市公务员考试行测真题及参考答案详解一套.docx
- 中关村实验室清华大学国防科大2025网络空间测绘技术白皮书139页.pdf
- 汽车电子行业系列报告之激光雷达篇激光雷达星辰大海国产供应链初长成-22011129页.pdf
- 非公路轮胎行业深度报告OTR轮胎需求盈利双高轮胎蓝海市场-23031718页.pdf
- 电子行业深度报告自动驾驶加速驶来车载激光雷达开启百亿蓝海市场-22011734页.pdf
- 电子行业佰维存储股份有限公司投资价值研究报告专注存储蓝海一体化解决方案龙头-22121292页.pdf
最近下载
- DB33_T1142-2017:基坑工程装配式型钢组合支撑应用技术规程.pdf VIP
- 公安专业科目讲义.pdf VIP
- 广东省深圳市育才一中学初2022-2023学年十校联考最后英语试题含答案.doc VIP
- 糖尿病人:饮食食谱表.pdf VIP
- 四川省绵阳市涪城区2025年中考二模化学试题(含答案).pdf VIP
- 急诊医学知识题库(附答案).docx VIP
- 人性化管理与制度化管理辩论词.docx VIP
- 全系列高品质上柴SC电站发动机介绍.PDF VIP
- 2025年四川省绵阳市涪城区中考二模语文试题(解析版).pdf VIP
- DB33T 1142-2017 基坑工程装配式型钢组合支撑应用技术规程.docx VIP
文档评论(0)