计算机系统结构(ch6)剖析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 向量处理机 6.1 向量处理的基本概念 6.2 向量处理机的一般结构 6.3 提高向量处理性能的常用技术 6.4 向量处理的性能评价 6.5 多向量多处理机 6.1 向量处理的基本概念 6.1.2 向量的处理方式 1、横向(水平)处理方式:向量计算是按行的方式从左至右横向地进行,即采用逐个求向量中各元素(分量)的方法来进行向量处理的方式。 2、纵向(垂直)处理方式:向量计算是按列的方式自上而下纵向地进行,即采用对两个向量按相同操作执行完之后,再转去执行别的操作的方法来进行向量处理的方式。 3、纵横(分组)处理方式:横向处理和纵向处理相结合的方式,将向量分成若干个组,组内纵向、组间横向。 1、横向(水平)处理方式 2、纵向处理方式 3. 纵横处理方式 6.1.3 向量处理机的基本系统结构 向量处理机的最关键的问题是存储器系统要能够满足运算部件带宽的要求。 1. 存储器-存储器结构(早期) 源、结果向量都在存储器中。多个独立的存储器模块并行工作,处理机结构简单,对存储系统的访问速度要求很高。如TI-ASC(72年)、CDC STAR-100(73年)、CYBER-205(80年)。 2. 寄存器-寄存器结构(主流) 源、结果向量都在向量寄存器中。运算通过向量寄存器进行,需要大量高速寄存器,对存储系统访问速度的要求降低。如CRAY-1(76年)、VP2000(91年)、VPP300/500(93年)、银河等。 6.1.3 向量处理机的基本系统结构 寄存器-寄存器结构中的向量指令 向量—向量指令(vector-vector instruction) 向量—标量指令(vector-scalar instruction) 向量—存储器指令(vector-memory instruction) 向量归约指令(vector reduction instruction) 聚集—散射指令(gather and scatter instruction) 屏蔽指令(masking instruction) 6.2 一般的向量处理机 6.2.1 寄存器组 向量寄存器组(V) 512个64位,8组,V0~V7,Vi可存放最多包含64个分量的向量。向量操作数的长度放在6位长的向量长度寄存器VL中。 Vi在同一时钟周期内可接收一个结果分量,并为下次操作再提供一个源分量,可以实现将二个或多个向量指令链接执行来提高向量操作的并行程度和功能部件流水的效能。 地址寄存器组(A) 8个24位,A0~A7,用于存放主存地址、变址值、移位计数值、循环计数值和I/O通道地址等。 标量寄存器组(S) 8个64位, S0~S7 中间寄存器: 标量保存寄存器组(T)和地址保存寄存器组(B) 6.2.2 多个单功能流水线 12个独立的单功能流水部件,分为4组: 3个向量运算部件:整数加、逻辑运算、移位; 3个浮点运算部件:浮点加、浮点乘、浮点迭代求倒数; 4个标量运算部件:整数加、逻辑运算、移位、加“1”计数; 2个地址运算部件:整数加、整数乘。 可用于向量运算的功能部件有整数加、逻辑运算、移位、浮点加、浮点乘、浮点迭代求倒数部件,所需的流水经过时钟数相应分别为3、2、4、6、7、14。 可用于标量运算的功能部件有整数加、逻辑运算、移位、加1计数,所需的流水经过时钟数相应分别为3、1、2~3、3~4。 6.2.3 运算流水线 6.3 提高向量处理性能的常用技术 多功能部件的并行操作 链接技术 加快条件语句和稀疏矩阵的处理 加快向量的归约操作 6.3.1 多功能部件的并行操作 向量寄存器(Vi)冲突:多条指令使用了同一个Vi 源向量冲突 V4←V1+V2、 V5←V1∧V3 结果向量冲突 V3←V1+V2、 V3←V5 × V4 先读后写的向量冲突 V3←V1+V2、 V1←V5 × V4 源目向量相关(先写后读) V3←V1+V2、 V5←V3 × V4 功能部件冲突 V4←V2 × V3、 V5←V1 × V6 多功能部件的并行操作 V2←V0 + V1、 V5←V3 × V4 6.3.2 链接技术(chaining) 链接是利用指令间存在的先写后读数据相关性来加快指令执行速度的技术。从一个流水线部件得到的结果可直接送入另一个功能流水线的操作数寄存器。(即中间结果不需存回存储器。实际上是标量流水线中相关专用通路在向量流水线中的应用)。 实现链接的条件: 前后指令存在先写后读的数据相关 前后指令没有其它向量寄存器冲突和运算部件冲突。 只有第一分量结果送入向量寄存器的那一周期可以链接。 先行的两条并行指令产生运算结果的时间必须相等。 两条向量指令的向量长度必须相等。 例 6.6 分析:第一、二条指令因既无向量寄存器使用冲突,也无功能部

文档评论(0)

w5544434 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档