计算机组成原理第9章课件(白中英编-科学出版社).pptVIP

计算机组成原理第9章课件(白中英编-科学出版社).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机组成原理第9章课件(白中英编-科学出版社).ppt

软件学院·计算机组织与结构 第9章 并行组织 计算机组成原理 任课教师:肖敏 贵州大学计算机科学与技术学院 第一章 计算机系统概论 第二章 运算方法和运算器 第三章 存储系统 第四章 指令系统 第五章 中央处理器 第六章 总线系统 第七章 外围设备 第八章 输入输出系统 第九章 并行组织 教材 白中英,计算机组成原理·网络版,科学出版社,2002 参考书 石磊,计算机组成原理·第2版, 清华大学出版社,2006 钱晓捷,微型计算机原理及应用, 清华大学出版社,2006 王爱英,计算机组成与结构·第3版, 清华大学出版社,2001 白中英 邝坚,计算机组织与结构·网络版,科学出版社,2003 第9章 并行组织 9.1 体系结构中的并行性 参见第5.8.1节 并行处理技术 9.2 互连网络 解决多处理机系统的互连问题 9.3 向量处理机 处理向量数据,提高指令级并行能力 9.4 阵列处理机 利用资源重复实现并行性 9.5 多处理机系统 多台独立的计算机组成 9.6 机群系统 分布计算机系统 9.2 互连网络 互连网络(interconnection)是并行处理系统的核心组成部分,也称网络(network)或通信子网 (communication subnet) 互连网络是由高速开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统内部多个功能部件或多个处理机之间的相互连接 结点(节点Node)是系统中的处理机或功能部件 静态互连网络在各个节点之间使用专用的连接通路,构成后在运行中固定不变 动态互连网络由程序控制,沿着连接通路使用开关或仲裁器实现所需的通信模式 9.3 向量计算机(vector processor) 最初面向诸如科学计算这样的超级计算应用问题 高层次处理向量:线性数组,用一条向量指令同时处理两个数组的运算;相当于标量处理的一个循环过程 向量处理方法 For (i=1; i=N; i++) d[i] = a[i] *(b[i] + c[i]) ; 水平(横向)处理方式 逐个求d[i],先计算d[1] = a[1] *(b[1] + c[1]) ,再计算d[2],……,最后计算d[N] 垂直(纵向)处理方式 将整个向量按相同的运算处理完后,再执行别的运算 分组(纵横)处理方式 把长度为N的向量,分成若干组,每组长度为n,组内按纵向方式处理,依次处理各组 向量处理机的结构 存储器-存储器结构 所有向量操作是在存储器与存储器之间进行 图9.10 寄存器-寄存器向量结构 所有向量操作是在向量寄存器之间进行(除向量读取和存储) 对应标量的寄存器-寄存器(load-store)结构 图9.12 向量机的特点 一条指令执行大量运算(相当于标量处理的一个循环) 减少了大量取指操作 每个结果都与前一个结果不相关 编译器保证了不存在相关 多个操作可以并行执行 更简单的设计,更高的时钟频率 减少了流水线中的分支及其延迟 向量指令以确定的方式访问存储器 有效的预取 通过大量数据元素分摊了存储器延迟 可充分利用高带宽的存储器系统 无需(数据)Cache 向量处理机的未来 从20世纪70年代中期,向量机从一个新结构发展到为工程师和科学家提供高效的计算能力 超标量微处理器的高性能价格比使得价格昂贵的向量超级计算机(supercomputer)走向终结 另一方面,超标量微处理机开始应用早期向量处理机的成熟技术 多数商用微处理器都加入了多媒体扩展指令,被称为SIMD指令 例如,Pentium 4支持的整数MMX指令,浮点数SSE/SSE2/SSE3指令 9.4 阵列处理机 阵列处理机是单指令流多数据流结构的专用计算机,也称为SIMD计算机、并行处理机 阵列处理机主要采用硬件的资源重复方法实现并行性,对大量数据进行向量处理 分布式存储器的阵列机 每个处理单元PE有各自的本地存储器LM 图9.15 共享存储器的阵列机 集中设置存储器,共享的多体并行存储器SM通过网络与各个处理单元PE相连 图9.16 9.5 多处理机系统 多处理机由若干台独立的计算机组成,每台计算机能够独立执行自己的程序;处理机之间通过互连网络进行连接,从而实现程序之间的数据交换和同步 多处理机属于MIMD计算机,实现任务或作业级的并行 紧耦合系统通过总线或高速开关实现互连,具有较高的物理连接频带,可以共享主存;松耦合系统通过通道或通信线路时间互连,可以共享外存 同构型多处理机系统的每个处理机是同类型的,完成同样的功能;异构型多处理机系统由多个不同类型,担负不同功能的处理机组成 并行向量处理机PVP、对称多处理机SMP、大规模并行处理机MMP、分布共享存储器多处理机DSM 9.6 机群(集群) 机群系统(Cluster)通过高速互连网络将通

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档