计算机系统结构-第六章-2009-2010-1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构-第六章-2009-2010-1

计算机系统结构 -第六章 向量流水技术 本章的主要内容 向量流水机的基本系统结构 向量操作长度控制和向量访问步长 向量处理方法 增强向量处理性能的方法 向量处理性能的评估参数和方法 向量化编译技术 6.1 向量流水机的基本系统结构(1) 标量流水线性能受限的原因 流水线的时钟周期不可能取的很短 取指和译码的速率受限 6.1 向量流水机的基本系统结构(2) 定义: 面向向量型并行计算,以流水线结构为主的并行处理计算机 应用领域:向量机适用于线性规划、傅里叶变换、滤波计算以及矩阵、线性代数、偏微分方程、积分等数学问题的求解,主要解决气象研究与天气预报、航空航天飞行器设计、原子能与核反应研究、地球物理研究、地震分析、大型工程设计,以及社会和经济现象大规模模拟等领域的大型计算问题。 6.1 向量流水机的基本系统结构(3) 向量流水处理的主要特点 向量指令之间是相互独立的(什么相关?) 指令带宽要求低 向量指令可以高速访问(系统结构中的什么原理?) 6.1 向量流水机的基本系统结构(4) 向量机的分类(按操作数和结果的存放位置) 存储器-存储器工作方式 寄存器-寄存器工作方式 6.1 向量流水机的基本系统结构(5) Y=aX+Y 标量机中的实现 向量机中的实现 LD F0,a ADDI R4,Rx,#512 LOOP: LD F2,0(Rx) MULD F2,F0,F2 LD F4,0(Ry) ADDD F4,F2,F4 SD 0(Ry) , F4 ADDI Rx,Rx,#8 ADDI Ry,Ry,#8 SUB R20,R4, Rx BNZ R20,Loop LD F0,a LV V1,Rx MULTV V2,F0,V1 LV V3,Ry ADDV V4,V2,V3 SV Ry,V4 9*64+2=578 6 6.1 向量流水机的基本系统结构(6) 向量指令的执行时间 并不是每个节拍就完成一条向量指令 6.2 向量操作长度控制和向量访问步长(1) 6.2 向量操作长度控制和向量访问步长(2) 原程序 采用分段技术后的程序 Do 10 i=1,n 10 Y(i)=a*X(i)+Y(i) low=1 VL=(n mod MVL) Do 20 j=0,(n/MVL) Do 10 i=low,low+VL-1 Y(i)=a*X(i)+Y(i) 10 continue Low=low+VL VL=MVL 20 continue 6.2 向量操作长度控制和向量访问步长(3) 向量的跨步访问 Do 10 i=1,100 Do 10 j=1,100 A(i,j)=0.0 Do 10 k=1,100 10 A(i,j)=A(i,j)+B(i,k)*C(k,j) 6.2 向量操作长度控制和向量访问步长(3) 访问步长和存储体 数目互为质数关系 6.3 向量处理方法(1) 处理的原则 避免数据相关 减少功能切换 6.3 向量处理方法(2) 6.3 向量处理方法(3) 6.4 增强向量处理性能的方法(1) 多功能部件的并行操作 使用多个功能部件 满足约束条件 不存在向量寄存器使用冲突(相同的源或者目的操作数,或者RAW相关) 不存在功能部件使用冲突(相同的操作类型) 6.4 增强向量处理性能的方法(2) 链接技术 存在RAW相关 利用向量处理中的流水线技术 优点:执行速度快(P153的例子) 缺点:时间同步要求高 ADDV V1,V2,V3 MULTV V4,V1,V5 LD V3,A

文档评论(0)

asd522513656 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档