计算机体系结构第六章.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机体系结构第六章

第六章 向量流水线技术(P347)——前言 向量处理机结构目前已成为解决数值计算问题的一种最重要的高性能结构。 向量处理机的性能价格比是很引人注目的,因为与相同价格的串行处理机相比,它们的向量运算吞吐量要高出1~2个数量级。但是,这种吞吐量提高只是对特定结构问题而言,也就是说,局限于那些可以转化为向量运算的问题。 第六章 向量流水线技术----向量处理机的结构 第一节 向量处理机的结构 向量处理机设计中要解决两个问题: (1)设法维持连续数据流(提供连续的A和B)。 (2)设法降低对存储器压力。 向量处理机一般采取以下技术措施: (1)用多独立存储器模块达到需要带宽。例STAR-100,32体。 (2)增设高速中间存储器——向量寄存器。 根据采用技术措施不同,向量处理机分为两种不同结构: (1)存储器——存储器结构 (2)寄存器——寄存器结构 第一节 向量处理机的结构 (1)存储器——存储器结构 第一节 向量处理机的结构 第一节 向量处理机的结构 典型系统: CDC的STAR-100,1973年完成。 主要技术参数: 主频:40ns;字长:64位;主存容量:100万字,磁芯存储器,32体,存储周期为1.28微妙,每个体的数据宽度为8个字, STAR-100存储系统的频带宽度为: (32*8)/1.28微妙=2*字/秒 第一节 向量处理机的结构 使主存有较高带宽的另一种方法是由一级或多级中间存储器形成一个层次结构存储器系统,其中带宽最高的这级存储器安排在距处理器最近位置。即寄存器一寄存器结构。 CRAY-1是世界上第一台向量流水处理巨型机。是美国Cray公司于1976年提供产品。运算速度达亿次/秒以上巨型机。速度这么高的一个原因是它采用了层次结构的存储器系统。 第一节 向量处理机的结构 (3)两种结构的简单比较: 第一种结构是依靠主存来保证流水线所需的操作数。因此主存必须具有至少和运算器所要求带宽一样高的带宽。这就要求主存或者存取速度足够快,或者分为多个独立的存储模块,或者两者都具备,因为运算器要求的最大带宽非常高。 第二种结构是通过容量比主存小得多的中间存储器即寄存器来保证很高的带宽。这样,低速存取主存就不会妨碍流水结构运算器连续运行。第二种结构的另一好处是流水结构运算器可以重叠进行,因为高速寄存器带宽足以满足几个流水结构运算部件的带宽要求。 由于同步的要求,数据进入和流出每个功能部件,包括访存都需要1拍时间。 若采用链接技术,则执行时间为: (1+ 6+1)+(1+7+ 1)+(N-l) = N+16拍 若这三条指令全部用串行方法,则执行时间为: [ (1+6+1)+N-1]+[(1+6十1)+N-1]+[(1+7+1)+N-1] = 3N+ 22拍 若前两条指令并行执行,第三条指令串行执行,则执行时间为: [(1+ 6+1)+ N-1]+[( 1+7+ l)+ N-1] = 2N+ 15拍 (3) 冲突及其分类 6.3.2 最大性能R∞ 本章小结 附录1 第六章参考答案(P391) * * 本章任务了解向量处理机特点、一般结构, 并掌握提高向量处理机性能方法。 6.1 特点 多数为巨型机,绝大多数向量处理机都采用流水线结构。当一条流水线不能达到所要求性能时,设计者往往采用多条单功能流水线。 为实现向量化处理,向量处理机操作部件一般采用流水线结构。下面是典型的向量加法器结构: 主存储器由多个存储器模块构成。流水线运算器与主存储器系统间有三条相互独立的数据通路,各数据通路可同时工作。 假设一个存储周期占两个处理机周期。 下图是计算C=A+B最理想方法。 (2)寄存器-寄存器结构 简化的Cray-l的框图:主存与流水结构运算器间有一级或两级中间存储器。 中间存储器与CACHE比特点:不透明;访问快;支持新数据结构 6.2 典型工作方式 CRAY-1是世界上第一台向量流水处理巨型机。 (1) CRAY-1技术术语 向量寄存器组V0,V1,……,V7。 分量计数器 链接方式(P370) 启动、输出延迟(各1拍)。 D=A*(B+C)向量长度<=64,B和C已取至V0和 V1, V3←A V2 ←V0+V1 V4 ←V2*V3 第一、二条指令既无寄存器冲突,也无功能部件冲突,可并行执行。 第三条与第一、二条指令均存在先写后读的相关冲突,可将第三条与第一、二条指令链接。 (2) 链接技术(369) 前一条指令结果不必送回存储器直接作为后一条指令的操作数,甚至可在前一条指令完成之前就使用其结果。 假设向量长度为N, 分析: 实现链接除了无向量寄存器使用冲突和无功能部件使用冲突外,还有时间上的要求,只有当

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档