CA第五章—多处理机系统培训资料.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CA第五章—多处理机系统培训资料.ppt

阵列机结构(cont.) 阵列机中PE之间的互联通信是由互联寄存器来实现的。当PE执行互联指令时,由本PE的互联寄存器与相邻PE互联寄存器进行信息交换。 阵列机结构(cont.) 阵列机的操作分公共操作和本地操作。公共操作是指阵列机中的所有PE同时执行的操作,它一般由逻辑控制器来调度。本地操作是每个PE自己的操作,它由PE的指令译码、执行。 像指令操作那样,阵列机的存储器有双重变址机构,除了逻辑控制器的公共变址外,还有每个PE自己的单独变址。这样既节省了公共数据和指令所占的存储空间,又增加各PE对存储器数据分配的灵活性。 阵列机结构(cont.) 一般,每个PE都配有状态寄存器,它标志了目前本PE处于活动状态还是处于屏蔽状态;运算结果是否有错;矩阵边缘处于何种连接等等各种状态信息。 高性能计算机分三大类 PVP向量型超级计算机,如国防科技大学研制的银河I(1亿次/秒)、银河II(10亿次/秒)。 MPP大规模并行处理超级计算机,如国防科技大学研制的银河III(130亿次/秒)、中国科学院计算机技术研究所研制的曙光1000(25亿次/秒)、中国江南计算机技术研究所研制的神威I(3840亿次/秒)。 Cluster集群计算机,中国科学院计算机技术研究所研制的曙光2000-II(1100亿次/秒)、 曙光3000(4030亿次/秒)、清华大学研制的THNPSC-1(320亿次/秒)、,上海大学研制的自强2000(4500亿次/秒)。 大规模并行处理机(MPP) 1979年,美国NASA-Goddard中心与Goodyear宇航公司合作研制一台用于处理遥感卫星图片的大规模SIMD阵列机获得成功。由于这台机器用了128*128=16384个可并行工作的微处理机,因此被定名为大规模并行处理机MPP(Massively Parallel Processor)。 MPP可对变长的操作数按位片进行算术运算。MPP有一个微程序控制器,能够十分灵活地定义向量、标量和I/O操作的指令系统,整个MPP系统均用微处理器芯片和SRAM芯片组成。 大规模并行处理机(cont.) 阵列部件ARU(ARray Unit)由128*128个PE构成一个二维阵列,以SIMD方式工作。 每个PE有一个1027位SRAM,有奇偶校验功能 每个PE是位片式微处理机,与四周近邻相连。 程序员可在平面、水平圆柱、垂直圆柱、开螺线、闭螺线等五种阵列拓扑中任选一种,增加了阵列机结构的灵活性。 大规模并行处理机(cont.) 在阵列中增加了4列冗余PE,使阵列的物理结构为132列*128行。阵列硬件出现故障时可旁路掉故障列方法,使阵列逻辑结构仍为128*128。 每个PE内有一个串行加法器及用一个移位寄存器实现位串式加法。 PE阵列的时钟周期为100ns。阵列控制器ACU是微程序控制器,对PE阵列处理进行管理,完成标量运算以及控制数据在PE阵列上移位。 大规模并行处理机(cont.) 程序和数据管理部件PDMU(Program and Data Management Unit)是一台后端小型计算机,其作用是管理阵列中的数据流,将程序装入控制器,进行系统的测试和诊断并提供程序开发手段等。 MPP系统运行方式有两种,独立方式由用户在终端予以操作控制;在线方式由外接计算机予以控制。MPP与外接计算机之间的数据传输速率为6MB/s,按高速数据方式运行时,数据通过128位外部接口传输,其速率可达320MB/s。 多处理机的基本结构 常用的松散耦合和紧密耦合这两种形式 松散耦合多处理机结构:互联常用通道或通信线路来实现,它们连接的频带较低。 紧密耦合多处理机结构:通常是高速总线或高速开关实现机间互联,以共享存储器。 多处理机的基本结构 通道连接的多处理机结构: 每台计算机是独立的,它们之间通过通道适配器连接。在进行通信时,发送的计算机可以把接受的计算机认为是自己的一个I/O设备,从而能完成两个主存储器之间的数据传送。 多处理机的基本结构(cont.) 信息传输系统连接的多处理机结构: 计算机模块通过一个信息传输系统连接起来。信息传输系统是耦合程度较低的,常用简单的分时总线及环形、星形等拓扑结构的系统。 每个计算机模块可以是独立的计算机,它有处理单元、存储器、I/O部件。而模块与信息传输系统则通过通道仲裁开关相连。通道仲裁开关的作用除使要通信的计算机模块与被通信的计算机模块在信息传输系统里连接起来外,还起到多个模块同时申请信息传输系统时,决定本模块是提出申请还是延缓提出申请,故称有仲裁作用。 多处理机的基本结构(cont.) 紧密耦合多处理机结构是真正的MPP: 多个处理器通过互联网络(它是由高速开关来组成的)共享集中的主存储器(它由若干个存储模块组成)和多个输入输出

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档