- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 当任务源源不断流入流水线的时候,流水线的吞吐率最高,加速比最高,效率最高。 然而,愿望是美好的,任务不可能源源不断的流入流水线,那么为什么呢? 当前一条指令的操作结果时候一条指令的操作数时,前一条指令未执行完,后一条指令不能开始执行; 前一条指令一旦判断出是分支指令,并且成功跳转,那么后一条指令就白放入流水线了。 因此,种种原因导致了流水线的断流。那么这节课,我们就来分析其原因。 在分析原因之前,我们先来介绍一个经典的5段流水线。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 3.6 向量处理机 在向量方式下,计算DAXPY循环所需要的时钟周期数为: Tv = 64+3nv 根据向量长度临界值的定义,有: Tv = Ts 64+3nv = 59nv = 64 56 = 2 nv 习 题 设向量长度均为64,在CRAY-1机上所有浮点功能部件的执行时间分别为:乘法7拍,加法6拍,求倒数近似值14拍,从存储器读数6拍,打入寄存器和启动功能部件各一拍,请问下列各指令组,组内哪些指令可以链接?哪些不能链接?不能链接的原因是什么?分别计算出各指令组全部完成所需要的拍数。 (1)V0←存储器 (2)V2←V0*V1 V1←V2+V3 V3←存储器 V4←V5*V6 V4←V2+V3 ? (2)V0←存储器 (4)V0←存储器 V2←V0*V1 V1←1/V0 V3←V2+V0 V3←V1*V2 V5←V3+V4 V5←V3+V4 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 3.6 向量处理机 CRAY-1向量指令类型 Vk ← Vi op Vj Vk ← Si op Vj Vk ← 主存 主存 ← Vi 3.6 向量处理机 提高向量处理机性能的方法 设置多个功能部件,使它们并行工作。 采用链接技术,加快一串向量指令的执行。 采用分段开采技术,处理大向量。 采用多处理机系统,进一步提高性能。 3.6.3 提高向量处理机性能的方法 3.6 向量处理机 设置多个功能部件 设置多个独立的功能部件。这些部件能并行工作,并各自按流水方式工作,从而形成了多条并行工作的运算操作流水线。 例如:CRAY-1向量处理机有4组12个单功能流水部件: 向量部件:向量加,移位,逻辑运算 浮点部件:浮点加,浮点乘,浮点求倒数 标量部件:标量加,移位,逻辑运算, 数“1”/计数 地址运算部件:整数加,整数乘 3.6 向量处理机 链接技术 链接特征:具有先写后读相关的两条指令,在不出现功能部件冲突和源向量冲突的情况下,可以把功能部件链接起来进行流水处理,以达到加快执行的目的。 链接特性的实质 把流水线定向的思想引入到向量执行过程的结果。 3.6 向量处理机 例3.3 在CRAY-1上用链接技术进行向量运算 D=A×(B+C) 假设向量长度N≤64,向量元素为浮点数,且向量B、C已存放在V0和V1中。 画出链接示意图,并分析非链接执行和链接执行两种情况下的执行时间。 解 用以下三条向量完成上述运算: V3 ← 存储器 // 访存取向量A V2 ← V0 + V1 // 向量B和向量C进行浮点加 V4 ← V2 × V3 // 浮点乘,结果存入V4 3.6 向量处理机 假设:把向量数据元素送往向量功能部件以及把结果存入向量寄存器需要一拍时间,从存储器中把数据送入访
您可能关注的文档
- 第六章 设计图样的绘制(第一节 设计表现图).ppt
- 第六章 醛酮醌-徐洲 - 复习.ppt
- 第六章机器人控制.ppt
- 第六讲_SAN拓扑结构与主要应用.ppt
- 第十一章 实验十二 探究单摆的运动 用单摆测重力加速度.ppt
- 第十三-十四章 氨基酸、蛋白质和核酸.ppt
- 第十二章 糖类化合物-徐洲.ppt
- 第十二章-脂类-徐洲.ppt
- 第十章 排序g1.ppt
- 第十章 胺有机化合物-徐洲.ppt
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
原创力文档


文档评论(0)