第7章.多指令流多数据流计算机ppt.pptVIP

下载本文档

21
0
约2.72万字
约 184页
2015-08-08 发布于浙江
举报
版权申诉

第7章.多指令流多数据流计算机ppt.ppt

1、本文档共184页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第7章.多指令流多数据流计算机ppt.ppt

目录第7章多指令流多数据流计算机 7.1 MIMD计算机结构模型与访存模型 7.2 对称多处理机系统 7.3 单指令流多数据流 7.4 大规模并行处理机系统 7.5 机群系统 7.6 分布式共享存储系统 7.7 并行算法的性能评测 7.1 MIMD计算机结构模型与访存模型本节首先介绍各类MIMD计算机的结构，然后抽象出具有普遍意义的MIMD计算机体系结构模型，包括MIMD计算机的结构模型和访存模型。并行计算机体系结构一般可分为以下6类：单指令流多数据流（SIMD）计算机；并行向量处理机（PVP）；对称多处理机（SMP）；大规模并行处理机（MPP）；工作站机群（COW）和分布式共享存储系统（DSM）。其中后5种都属于多指令流多数据流（MIMD）计算机。 7.1.1 MIMD计算机结构模型 5种MIMD并行计算机的结构如图7.1所示。其中，VP是向量处理机，SM是共享存储器，P/C是微处理器和高速缓存，LM是本地存储器，NIC是网络接口电路，MB是存储器总线，DIR是为解决高速缓存一致性问题而设置的高速缓存目录存储器，IOB是I/O总线，LD是本地磁盘，B是存储总线与I/O总线之间的接口。 MIMD计算机体系结构合一的结构模型 20世纪90年代以后，上述各种并行计算机的体系结构呈现渐趋一致的趋势。促使体系结构渐趋一致而最终合一的主要因素是：所有体系结构都要求快速的高质量的互连网络；都希望尽量避免或降低延迟；都希望能尽量隐藏通信代价；都必须支持不同的同步形式；等等。根据各种MIMD计算机的体系结构渐趋一致的发展趋势，当代并行计算机的公共结构模型如图7.2所示。可扩放并行计算机公共结构模型 7.1.2 MIMD计算机访存模型 1. 均匀存储访问模型 UMA模型的特点 ① 物理存储器（SM1~SMm）被所有处理器均匀共享。所谓均匀共享是指：所有处理器访问任何存储器所需的时间都相同。 ② 每个处理器可带有私有高速缓存。 ③ 外围设备以一定的形式被共享。 2. 非均匀存储访问模型 NUMA模型的特点 ① 被共享的存储器在物理上是分布在所有的处理器中，所有的本地存储器（LM1~LMn）的集合组成全局地址空间。 ② 处理器访问存储器所需的时间不相等，访问本地存储器LM或通过群内互连网络（Cluster Interconnection Network，CIN）访问群内共享存储器（Cluster Shared Memory，CSM）费时较少，访问非本地存储器或通过全局互连网络（Global Interconnection Network，GIN）访问全局共享存储器（Global Shared Memory，GSM）费时较多，即所谓非均匀存储访问。 ③ 每个处理器可带有私有高速缓存，外设也可以以某种形式共享。 3. 全高速缓存存储访问模型全高速缓存存储访问（Cache-Only Memory Access，COMA）模型如图7.5所示，它是NUMA模型的一种特例。 COMA模型的特点 ① 各处理器结点中没有存储层次结构，全部高速缓存组成全局地址空间。 ② 利用分布的高速缓存目录D对远程高速缓存进行访问。 ③ COMA中的高速缓存容量一般都大于二级高速缓存容量。 ④ 开始使用COMA时，数据可以任意分配到高速缓存C中，在运行过程中，数据将被迁移到使用该数据的处理器结点的高速缓存中。 4. 高速缓存一致性非均匀存储访问模型高速缓存一致性非均匀存储访问模型如图7.6所示，它的一个结点实际上是一个SMP机器，通过互连网络把若干个SMP机器连接而成的一个较大规模的多处理机系统。 CC-NUMA模型的特点 ① 绝大多数商用CC-NUMA多处理机系统都使用基于目录的高速缓存一致性协议来维护Cache的一致性。 ② 保留了SMP结构的易于编程的优点，同时也改善了常规SMP结构的可扩放性问题。 ③ CC-NUMA模型实际上是一个分布共享存储（DSM）多处理机系统模型。 ④ CC-NUMA模型最显著的优点是程序员无需明确地在结点上分配数据。 5. 非远程存储访问模型在一个分布存储的多处理机系统中，如果所有的存储器都是私有的，仅能由本地处理器访问，就称为非远程存储访问（NO-Remote Memory Access，NORMA）。基于消息传递的NORMA多计算机一般模型如图7.7所示。 NORMA模型的特点 ① 每个结点都是由处理器（P）、本地存储器（M）和（或）I/O设备组成的自治计算机。多个结点由基于消息传递的互连网络互连。 ② 所有的存储器都是私有的。 ③ 绝大多数NORMA都不支持远程存储器的访问。 MIMD计算机的结构模型与访