计算机系统结构4-1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构4-1

* 向量链接图示例(pp,104) 处理机自动检测每一条向量指令是否与前一条指令形成链接。 若满足链接条件,便启动本指令工作而形成链接。 数据进(出)每个功能部件,包括存器,需1个时钟周期。 LV?????? V3,M(A)?????? ?? ; V3←A ???????ADDV????? V2,V0,V1?????? ; V2←V0+V1 ???????MULV????? V4,V2,V3????? ; V4←V2×V3 * 空间上:无向量寄存器和功能部件使用冲突 时间上: 1)只有当前一条指令的第1个结果分量送入结果向量寄存器的那一个时钟周期方可链接。 2)当一条向量指令的两个源操作数分别是两条先行指令的结果寄存器时,先行两条指令产生运算结果的时间必须相等,同时,两条向量指令的向量长度必须相等。 例如 链接条件问题 LV?????? V3,M(A)?????? ?? ; V3←A ???????ADDV????? V2,V0,V1?????? ; V2←V0+V1 ???????MULV????? V4,V2,V3????? ; V4←V2×V3 * 假定,一个程序段有以下三个向量操作: V3 ← A V2 ← V0 + V1 V4 ← V2 * V3 +1 +1 +1 +1 +1 数据进出每个功能部件,需1个时钟周期 向量在加法部件的执行时间为 (1+6+1)+N-1 链接后 执行时间增加? (1+7+1) * 链接运算时间 假设向量长度为N,则不同方法的执行时间为: (1)若3条指令全部用串行方法,执行时间为? [(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1] =3N+22(时钟周期) (2)若前两条指令并行,第3条指令顺序执行,时间为 ? [(1+6+1)+N-1]+[(1+7+1)+N-1] =2N+15(时钟周期) (3)若前两条指令并行执行,并采用链接技术,时间???????? (1+6+1)+(1+7+1)+N-1=17+N-1 =N+16(时钟周期) * 分段开采技术? 当向量长度大于向量寄存器的长度时,长向量须分段处理,即一次处理一个向量段。 处理长向量的程序结构称为向量循环。也称为分段开采技术。。 长向量分段成循环是系统硬件和软件控制完成,对程序员是透明的。即看不到分段过程,一次循环,就处理长向量的一个段。 进入循环前,系统会根据向量长度计算出循环的次数。 ??? * 例5:有个循环程序代码段: ??????????????????????? DO?????? 10 ????? i=1,n ??????????????????????? 10????? A(i)=5*B(i)+C 其中n和C为常数,设向量寄存器长度为64元素,用分段开采技术改造成向量循环形式。 分段处理程序为 LOW=1 ???VL=(n mod 64)??????????????? ; 找出余数长度值 ?? DO??? 20??? j=1,(n/64)????? ; 外循环 ?? DO? 10??? i=LOW,LOW+VL-1??? ; 以长度VL操作 ???????????? A(i)=5B(i)+C????? ; 主要操作 ? 10? continue ?????? ??LOW=LOW+VL?????????????? ; 下一向量的开始 ??????? ?VL=64???????????????????? ; 将向量长度值恢复成64 ?? 20? continue 第一次循环中首先产生A(i)的余数( VL)个分量。 分段需要一定的时间开销,包括流水线启动开销。 分段开采技术? * 多处理机体系结构 前三种技术措施都是在单处理机结构的向量计算机上实现的。 为了有效地提高向量处理性能,新型向量机可采用多处理 机体系结构。 下图是CRAY X-MP的结构框图,它由4个CPU组成。CPU的 结构同CRAY-1向量处理机相似。 * 多处理机体系结构的设计原则 在确定的应用背景下,向量处理机性能应该随处理机数目的增加而线性地提高。 体系规模的扩展性不仅涉及CPU,还涉及存储器和I/O资源,价格和效率等因素。 设计多处理体系结构时,力求做到处理速度、存储容量和I/O吞吐能力三者之间的平衡。否则会出现瓶颈,整个体系的效率得不到发挥。 * 小 结 讲述了指令级并行的另一类机器:向量流水处理机。?向量处理机是解决数值计算问题的一种重要的高性能结构,这种机器能较好地发挥流水线技术的特性,可以达到较高的计算速度。

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档