网站大量收购独家精品文档,联系QQ:2885784924

第7章.多指令流多数据流计算机ppt.pptVIP

  1. 1、本文档共184页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章.多指令流多数据流计算机ppt.ppt

目 录 第7章 多指令流多数据流计算机 7.1 MIMD计算机结构模型与访存模型 7.2 对称多处理机系统 7.3 单指令流多数据流 7.4 大规模并行处理机系统 7.5 机群系统 7.6 分布式共享存储系统 7.7 并行算法的性能评测 7.1 MIMD计算机结构模型与访存模型 本节首先介绍各类MIMD计算机的结构,然后抽象出具有普遍意义的MIMD计算机体系结构模型,包括MIMD计算机的结构模型和访存模型。 并行计算机体系结构一般可分为以下6类:单指令流多数据流(SIMD)计算机;并行向量处理机(PVP);对称多处理机(SMP);大规模并行处理机(MPP);工作站机群(COW)和分布式共享存储系统(DSM)。其中后5种都属于多指令流多数据流(MIMD)计算机。 7.1.1 MIMD计算机结构模型 5种MIMD并行计算机的结构如图7.1所示。 其中,VP是向量处理机,SM是共享存储器,P/C是微处理器和高速缓存,LM是本地存储器,NIC是网络接口电路,MB是存储器总线,DIR是为解决高速缓存一致性问题而设置的高速缓存目录存储器,IOB是I/O总线,LD是本地磁盘,B是存储总线与I/O总线之间的接口。 MIMD计算机体系结构合一的结构模型 20世纪90年代以后,上述各种并行计算机的体系结构呈现渐趋一致的趋势。促使体系结构渐趋一致而最终合一的主要因素是:所有体系结构都要求快速的高质量的互连网络;都希望尽量避免或降低延迟;都希望能尽量隐藏通信代价;都必须支持不同的同步形式;等等。 根据各种MIMD计算机的体系结构渐趋一致的发展趋势,当代并行计算机的公共结构模型如图7.2所示。 可扩放并行计算机公共结构模型 7.1.2 MIMD计算机访存模型 1. 均匀存储访问模型 UMA模型的特点 ① 物理存储器(SM1~SMm)被所有处理器均匀共享。所谓均匀共享是指:所有处理器访问任何存储器所需的时间都相同。 ② 每个处理器可带有私有高速缓存。 ③ 外围设备以一定的形式被共享。 2. 非均匀存储访问模型 NUMA模型的特点 ① 被共享的存储器在物理上是分布在所有的处理器中,所有的本地存储器(LM1~LMn)的集合组成全局地址空间。 ② 处理器访问存储器所需的时间不相等,访问本地存储器LM或通过群内互连网络(Cluster Interconnection Network,CIN)访问群内共享存储器(Cluster Shared Memory,CSM)费时较少,访问非本地存储器或通过全局互连网络(Global Interconnection Network,GIN)访问全局共享存储器(Global Shared Memory,GSM)费时较多,即所谓非均匀存储访问。 ③ 每个处理器可带有私有高速缓存,外设也可以以某种形式共享。 3. 全高速缓存存储访问模型 全高速缓存存储访问(Cache-Only Memory Access,COMA)模型如图7.5所示,它是NUMA模型的一种特例。 COMA模型的特点 ① 各处理器结点中没有存储层次结构,全部高速缓存组成全局地址空间。 ② 利用分布的高速缓存目录D对远程高速缓存进行访问。 ③ COMA中的高速缓存容量一般都大于二级高速缓存容量。 ④ 开始使用COMA时,数据可以任意分配到高速缓存C中,在运行过程中,数据将被迁移到使用该数据的处理器结点的高速缓存中。 4. 高速缓存一致性非均匀存储访问模型 高速缓存一致性非均匀存储访问模型如图7.6所示,它的一个结点实际上是一个SMP机器,通过互连网络把若干个SMP机器连接而成的一个较大规模的多处理机系统。 CC-NUMA模型的特点 ① 绝大多数商用CC-NUMA多处理机系统都使用基于目录的高速缓存一致性协议来维护Cache的一致性。 ② 保留了SMP结构的易于编程的优点,同时也改善了常规SMP结构的可扩放性问题。 ③ CC-NUMA模型实际上是一个分布共享存储(DSM)多处理机系统模型。 ④ CC-NUMA模型最显著的优点是程序员无需明确地在结点上分配数据。 5. 非远程存储访问模型 在一个分布存储的多处理机系统中,如果所有的存储器都是私有的,仅能由本地处理器访问,就称为非远程存储访问(NO-Remote Memory Access,NORMA)。基于消息传递的NORMA多计算机一般模型如图7.7所示。 NORMA模型的特点 ① 每个结点都是由处理器(P)、本地存储器(M)和(或)I/O设备组成的自治计算机。多个结点由基于消息传递的互连网络互连。 ② 所有的存储器都是私有的。 ③ 绝大多数NORMA都不支持远程存储器的访问。 MIMD计算机的结构模型与访

文档评论(0)

zhiminwei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档