计算机系统结构第6章(rev 1).pptVIP

下载本文档

37
0
约6.52千字
约 48页
2018-01-02 发布于湖北
举报
版权申诉

计算机系统结构第6章(rev 1).ppt

1、本文档共48页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机系统结构第6章(rev 1)

6.2.3 SIMD计算机实例接下来分别介绍两种典型的SIMD计算机：Illiac IV阵列处理机和BSP计算机。 1. Illiac IV阵列处理机图6-26 Illiac IV阵列处理机总体框架 ⑴ Illiac IV阵列 Illiac IV阵列PU是由64个处理单元（PE）、64个局部存储器（PEM）和存储逻辑部件（MLU）组成。（a）处理单元之间的连接关系（b）Illiac IV处理部件的连接图6-26 Illiac IV阵列处理机的阵列连接概括起来，控制器的功能有以下5个方面：对指令流进行控制和译码，包括执行一整套标量操作指令；向各处理单元发出执行数组操作指令所需的控制信号；产生和向所有处理单元广播公共的地址部分；产生和向所有处理单元广播公共的数据；接收和处理由各PE（计算出错时）、系统I/O操作以及B6600所产生的陷阱中断信号。 6.2.4 SIMD处理机的算法举例 ⑴ 矩阵加假定两个8×8的矩阵A和B相加，所得到的结果矩阵C也是一个8×8的矩阵。需用下列3条汇编指令就可一次实现矩阵相加： LDA ALPHA?；全部（a）由PEMi送PEi的累加器RGAi中 ADRN ?ALPHA＋1；全部（a+1）与（RGAi）进行浮点加，结果送 RGAi STA ALPHA＋2；全部（RGA）由PEi送PEMi的a+2单元中。图6-29 矩阵相加存储器分配 ⑵ 矩阵乘设A、B和C为3个8×8的二维矩阵。若给定A和B，则C＝A×B的64个分量可利用下列公式计算。，0≤i≤6，0≤j≤6。如果在SIMD计算机上求解这个问题，可执行下列FORTRAN程序： DO?10?I＝0，6 C(I,J)=0 DO ?20 ?K=0,6 20??????C(I,J)=C(I,J)+A(I,K)*B(K,J) 10??????CONTINUE 图6-30 矩阵乘程序执行流程图图6-31 矩阵乘存储器分配 ⑶ 累加和假设累加的数为A(I)，其中I的取值范围为0≤I≤7，即共有8个数进行顺序累加。在SIMD计算机上可写成下列FORTRAN程序： C(-1) =0 DO 10 I=0, 7 10 C(I)=C(I-1)+A(I) 在SISD计算机上，它需要进行8次加法循环的时间。如果在并行处理机上，采用成对递归相加的算法，则只需要 =3次的加法时间。将原始数据A(I)存放在8个PEM的a单元中，求累加和：第1步将全部PEi置为活动状态第2步全部A(I)从PEMi的a单元读到相应PEi的累加寄存器RGAi中，0≤I≤6；第3步令K＝0；第4步全部PEi的(RGAi)转送到传送寄存器RGRi，0≤I≤6；第5步全部PEi的(RGAi）经过互连网络向右传送2k步距，0≤I≤6；第6步令j=2k -1；第6步置PE0至PEj为不活动状态；第8步处于活动状态的PEi执行(RGAi):＝(RGAi)＋(RGRi)操作；第9步 k:=k+1；第10步若k3，则转回第4步，否则继续往下执行；第11步将全部PEi置为活动状态，0≤I≤6；第12步全部PEi的(RGAi)存入相应PEMi的a+1单元中。上面描述的计算过程如图6-32所示。图6-32 阵列处理机上累加和的计算过程 6.3 MIMD计算机 MIMD计算机按照Flynn分类法是指多指令流多数据流计算机，它由多台独立的计算机组成，每台计算机能够独立执行自己的程序。 6.3.1 MIMD计算机结构 MIMD计算机根据存储器组织方式的不同，将MIMD计算机结构分成两类：共享存储器多处理机结构和分布式存储器多处理机结构。（a）共享存储器多处理机结构（b）分布式存储器多处理机结果 6-33 两种处理机结构 MIMD计算机在结构原理上有别于SIMD计算机的主要特点： ⑴ MIMD计算机有多个控制器，有多个指令部件，可以对各个PE实现单独的控制，并使其相互协调，相互配合。 ⑵ MIMD计算机的外围设备能够被多个PE分别调用，因而通过互连网络转接，外围设备访问主存储器进行程序和数组的传送时，不像SIMD计算机有规则。 ⑶ SIMD计算机主要完成数组和向量的运算，MIMD计算机的各个PE是随机地访问主存储器的，所以互连网络的连接模式、频带和路径选择等问题都要复杂得多。 6.3.2 MIMD计算机的特点