- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
图5.31CRAY—1的向量流水处理部分简图为了能充分发挥向量寄存器和可并行工作的6个流水线功能部件的作用,加快对向量的处理,将CRAY-1设计成每个Vi组都有连到6个功能部件的单独总线,而每个功能部件也都有把运算结果送回向量寄存器组的输出总线。这样,只要不出现Vi冲突和功能部件冲突,各个Vi之间和各个功能部件之间都能并行工作,大大加快了向量指令的处理,这是CRAY-1向量处理的一个显著特点。所谓Vi冲突指的是,并行工作的各向量指令的源向量或结果向量使用了相同的Vi。除了相关情况之外,就是出现源向量冲突,例如V4←V1+V2V5←V1∧V3这两条向量指令不能同时执行,必须在第一条向量指令执行完,释放出V1之后,第二条向量指令才能开始执行。因为虽然这两条向量指令的源向量之一都取自V1,由于二者的首元素下标可能不同,向量长度也可能不同,难以由V1同时提供两条指令所需要的源向量。所谓功能部件冲突指的是,同一个功能部件被一条以上的要求并行工作的向量指令所使用。例如V4←V2*V3V5←V1*V6这两条向量指令都需要使用浮点相乘流水功能部件,那就需在第一条向量指令执行到计算完最后一个结果分量,释放出功能部件之后,第二条向量指令才能开始执行。图5.32CRAY-1的4种向量指令CRAY-1向量处理的另一个显著特点是,只要不出现功能部件冲突和源向量冲突,通过链接机构可使有数据相关的向量指令仍能重叠并行处理。例如,对前述向量运算D=A*(B+C)若向量长度N≤64,向量为浮点数,则在B、C取到V0、V1后,就可用以下3条向量指令求解:V3←存贮器(访存取A向量)V2←V0+V1(B向量和C向量浮点加)V4←V2*V3(浮点乘,存D向量)图5.33通过链接技术实现向量指令之间大部分时间并行CRAY-1启动访存,把元素送往功能部件,把结果存入Vi都需要有1拍的传送延迟。由于第一、二条指令之间没有冲突,可以同时执行,并且“访存”拍数正好与“浮加”的一样,因此,从访存开始,直至把第一个结果分量存入V4,所需拍数(亦称为链接流水线的建立时间)为此后,每拍就可取得一个结果分量存入V4,一共只需17+(N-1)拍就可以执行完这3条向量指令,获得全部结果分量。显然,这要比第一、二条指令全执行完,所有分量全部送入V2、V3后,才开始执行第三条指令要快得多,因为后者需1+6+1+N-1+1+7+1+N-1=15+2N拍。CRAY-1指令可以链接的特点,使得它能灵活地组织各流水线功能部件的并行操作。最多能并行处理6条向量指令,进一步发挥这些流水线功能部件的效能。因此,链接技术是提高机器整体运算速度的一个非常重要的措施。CRAY-1的向量指令还可以通过让源向量和结果向量使用同一个向量寄存器组,并控制分量计数器值的修改,来实现递归操作。CRAY-1的每个向量寄存器组Vi都有一个相应的分量计数器。当一条向量指令开始执行时,它的源向量寄存器和结果向量寄存器相应的分量计数器均置成“0”。3.超级向量流水处理机举例美国CRAY研究公司成立于1972年,至今已生产了400台以上安装于世界各地的CRAY超级计算机。1979年生产的CRAY—1S是对CRAY—1的改进,它有10条流水线,时钟周期为12.5ns,使用CRAY操作系统COS,只允许单用户批处理。1983年的CRAYX—MP系列采用多处理机配置。1985年的CRAY—2S最多可采用4台CRAY—1,有2GB的共享存贮器,超流水线时钟为4.1ns。主要特点是,将操作系统由批处理COS改为多用户UNIX系统Ⅴ。1988年的CRAYY—MP,由8台处理机组成,时钟周期为6ns,共享1GB中央存贮器,采用256个体交叉访问。1991年问世的CRAYY—MPC—90是目前最大的CRAY机器,它是由16个类似于Y—MP的CPU组成的集成系统。CRAY公司1992年10月公布了MPP研究计划,目的是想解决目前大多数用RISC微处理器作为MPP系统构造块在性能、效率上的不足。CDC公司于1973年推出了第一台超级计算机STAR—100之后,于1982年生产了CYBER205。以后又推出了有8个CPU,共享存贮器和18台I/O处理机的ETA10,性能可达10GFLOPS。日本早期由Fujit
您可能关注的文档
最近下载
- 《基于PLC的四层电梯控制》-毕业论文.doc VIP
- 2.关于干部人事档案审核工作的问答(组工通讯〔总2764号〕).docx VIP
- 高速铁路无缝线路技术—无缝线路基本知识.pptx
- Q╱SY 05010-2016油气管道安全目视化管理规范.doc VIP
- 解码国家安全知到智慧树期末考试答案题库2025年国际关系学院.docx VIP
- 面料阻燃等级检测报告.docx VIP
- 重庆市鲁能巴蜀中学校2024-2025学年高一上学期期中考试数学试卷.pdf
- DB13_T 3035-2023 建筑消防设施维护保养技术规范.docx VIP
- 急性上消化道出血诊治流程专家共识(共33张PPT)【33页】.pptx VIP
- 林下中药材的种植技术.pptx
原创力文档


文档评论(0)