第7章PC计算机的系统结构.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 多处理机系统 Chapter 8 Multiprocessers 8.1 指令级并行性的限制和超线程技术 8.2 多处理器构成的系统结构 8.3 多处理器的Cache一致性 8.4 多处理器系统的同步机制 8.5 集群系统 8.6 多处理器系统的程序并行性 8.7 曙光5000超级计算机 本章小结 8.1指令级并行性的限制和超线程技术 8.1.1 指令级并行性的限制 8.1.2 超线程技术 8.1.3 限制单处理器发展的其它主要因素 8.1.1 指令级并行性的限制 1. 理想处理器 2. 理想处理器难以接近 (1)转移预测、重命名和相关性分析上依靠静态的编译分析是不可能完美的,动态分析受窗口局限 (2)错误的预测限制了指令的并行度 (3)寄存器的数目有限 (4)此外,每时钟周期发射指令数量、功能单元及单元延迟、寄存器文件端口、功能单元队列、对转移发射的限制、对存储器并行访问的限制以及对指令提交的限制等都是影响指令级并行的因素。 8.1.2 超线程(Hyper-Threading)技术 超线程技术是指在单处理器中采用的线程级并行技术,又称简单多线程技术。 超线程有两种主要方法:细粒度超线程和粗粒度超线程。 同时多线程(SMT)是超线程的一个改进版本,它使用多发射和动态调度机制在开发线程级并行的同时开发指令级并行。 8.1.3 限制单处理器发展的其它主要因素 尽管单处理器在提高指令集并行及采用超线程并行技术方面做出了很大努力,但在如下几个方面受到局限: (1)指令级并行约束及超线程技术的限制已经不太可能提高更多的并行性。 (2)仅靠提高频率的办法,难以实现性能的突破。反而带来功耗和内存、I/O速度平衡的问题。 (3)不断增加的单核芯片面积提高了生产成本,并且使得设计和验证所花费的时间变得更长。 (4)功耗与性能比问题日渐突出。 8.2 多处理器构成的系统结构 8.2.1 多核处理器结构 8.2.2 多处理器结构 8.2.3 多处理器并行处理定量分析和所遇到的问题 8.2.1 多核处理器结构 多核处理器是指在一个芯片上集成多个处理器核心,即CMP(Chip Multiprocessor,CMP单芯片多处理器)。这多个核心间联系非常紧密,甚至共享L1、L2和L3 Cache等。 CMP通常可分为同构CMP和异构CMP 在存储层次上,CMP结构的互连采用共享二级或三级Cache的CMP结构,每个处理器核心拥有私有的一级或二级Cache,且所有处理器核心共享下一级 Cache。 核间通信机制目前有两种,一种基于总线共享的Cache结构,一种基于片上的互连结构。 8.2.1 多核处理器结构 CMP在实际使用中具有如下优点: (1)微处理器厂商一般采用现有的成熟单核处理器作为处理器核心,从而可缩短设计和验证周期,节省研发成本。 (2)控制逻辑简单,扩展性好,易于实现。 (3)通过动态调节电压/频率、负载优化分布等,可有效降低CMP功耗。 (4)CMP采用共享Cache或者内存的方式,多线程的通信延迟较低。 8.2.2 多处理器结构 这种结构的特性是: (1)结构中的每个处理器取自己的指令并对自己的数据进行操作,即每个处理器执行自己的指令流,很容易实现多线程并行机制。 (2)MIMD灵活性强; (3)MIMD结构中的众多处理器可以由同一种处理器来组成 按照多处理器组成的规模,多处理器大致可分为4个层次。 (1)多核处理器 (2)中小规模多处理器 (3)大规模多处理器 (4)集群 商业集群和客户集群 8.2.2.2 MIMD计算机的基本结构 两种典型的结构:集中式共享存储器系统结构和分布式存储器系统结构。 1.集中式共享存储器系统 集中式共享存储器多处理器系统的优点是: (1)可以与传统的单处理器系统软件兼容。 (2)程序设计容易。 (3)通信开销小。 集中式共享存储器的结构组成的处理器不能太多,主要受到访存冲突和互联网络的带宽和复杂性的限制 2.分布式存储器多处理器系统 分布式存储器的主要优点是: ①如果大部分访存是对节点内的本地存储器进行的,这样做是增大存储器带宽的比较经济的方法; ②缩短了本地存储器访问的时延。 ③具有较好的扩展性。 主要缺点是由于处理器不再共享单一集中存储器,处理器间的数据通信在某种程度上变得更加复杂,且时延也更大。 分布式存储器有两种进行处理器之间通信的方式。 一种是分布式共享存储器(Distributed Shared-Memory,简称DSM)系统,它将物理上分开的存储器在逻辑上统一为一个地址空间,通过load和store操作在统一的地址空间上隐式地传递数据。 另

文档评论(0)

精品文档专区 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档