第4章SIMD计算机讲述.ppt

  1. 1、本文档共232页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章SIMD计算机讲述

清华大学计算机科学与技术系 汤志忠 第1章 计算机系统设计基础 第2章 数据表示与指令系统性能分析 第3章 流水技术和向量处理 第4章 阵列计算机 第5章 多处理机系统 第6章 数据流计算机 超级计算机---6种机器模型 SIMD阵列计算机 并行向量处理机(PVP) 对称多处理机(SMP) 大规模并行处理机(MPP) 工作站机群(COW) 分布式共享存储多处理机(DSM) 第4章 阵列计算机 4.1 并行处理技术的基本概念 4.2 SIMD并行处理机结构 4.3 SIMD并行计算机算法 4.4 SIMD计算机的互连网络 4.5 相联处理机 本章学习要求 了解并行性的基本概念、比较阵列机与多机系统并行性的特点 掌握典型的两种阵列机结构 重点掌握阵列机中的互连网络 了解相联处理机 4.1并行处理的基本概念 1.并行性 在数值计算,数据处理,知识处理或人工智能求解过程中,可能存在某些能同时进行运算或操作的部分。包括同时性和并发性 同时性(simultaneity):指两个或多个事件在同一时刻发生在多个资源中。 并发性(concurrency):指两个或多个事件在同一时间间隔内发生在多个资源中 在同一时刻或同一时间间隔内完成多个性质相同或不同的任务 2.并行处理 是一种相对串行处理的信息处理方式,侧重并发性。 (1)并行性粒度 当TC较大时,通信量大,则G 较小,处理粒度较细。反之对于粗粒度的并行,通信量较小。 粗粒度通常采用MIMD,细粒度则采用SIMD。 (2)并行性等级划分 4.2 SIMD并行计算机 并行处理机又叫SIMD计算机。它是单一控制部件控制下的多个处理单元构成的阵列,所以又称为阵列处理机。 多处理机是由多台独立的处理机组成的系统。 一、并行处理机的基本构成 并行处理机是通过重复设置大量相同的处理单元PE(Processing Element),将它们按一定的方式互连,在统一的控制部件CU(Control Unit)控制下,对各自分配来的不同数据并行地完成同一条指令所规定的操作。各PE之间的数据交换由ICN来实现。 从CU看,指令是串行执行的,从PE看,数据是并行处理的。按照佛林分类法,它属于SIMD计算机。 并行处理机的应用领域: 主要用于高速向量或矩阵运算中。 并行处理机的操作模型可用五元组来表示: M=(N,C,I,M,R), 其中: N 为PE个数。如IlliacIV有64个PE。 C 为由控制部件CU直接执行的指令集,包括标量指令和程序控制指令。 I 为所有PE并行执行的指令集,包括算术运算、逻辑运算、数据寻径、屏蔽以及其它由每个活动的PE对它的数据所执行的局部操作。 M 为屏蔽操作集,每种屏蔽将PE划分为允许操作和禁止操作两个子集。 R 是数据寻径集,说明互连网络中PE间通信所需要的各种设置模式。 二、并行处理机分类 并行处理机根据存贮器采用的组成方式不同分成两种基本结构。 1.分布存贮的并行处理机 各个处理单元设有局部存贮器存放分布式数据,只能被本处理单元直接访问。此种局部存贮器称为处理单元存贮器(Processing Element Memory)PEM。 在控制部件CU内设有一个用来存放程序的主存贮器CUM。整个系统在CU统一控制下运行系统程序和用户程序。 工作原理:所有指令都在控制部件中进行译码。译码后把只适合串行处理的标量或控制类指令留给控制部件自己执行,而把适合于并行处理的向量类指令“广播”给各个处理单元(PE),控制让处于“活跃”的那些PE去并行地执行。各个处理单元可直接访问自已的局部存储器(PEM),但它们之间的数据交换由互连网络(ICN)来实现。 2.共享存贮的并行处理机 每个PE没有局部存储器,存储模块以集中形式为所有PE共享。互连网ICN受CU控制,具有双向性,采用分布式存贮器组成基本结构。 在采用集中式共享主存的构型中,K个存贮分体的数据经处理单元-主存模块互连网络ICN为全部N个处理单元所共享,要求K≥N。各处理单元在访问主存时,为避免发生分体冲突,也要求有合适的算法能将数据合理地分配到各个存储体中。 三、并行(阵列)处理机的结构特点 速度快,特别适于高速数值计算。 SIMD 依靠的是资源重复,而不是时间重叠。它依靠增加PE个数,与流水线处理机主要依靠缩短时钟周期相比,其提高速度的潜力要大得多。 依赖于互连网络和并行算法。互连网络决定了PE之间的连接模式,也决定了并行处理机能够适应的算法。 不同结构对应的并行算法的实现方法不同,ICN的研究成为并行处理的又重点问题之一。 需要有一台高性能的标量处理机。 并行处理机与流水处理机的比较 流水处理机 方式:时间重叠,并行性中

文档评论(0)

441113422 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档