[四年级英语]01 并行计算机模型.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[四年级英语]01 并行计算机模型

Advanced Computer Architecture 参考教材: (1)英文原版:Kai Hwang, Advanced Computer Architecture – Parallelism, Scalability ,Programmability (1993) 中译本:高等计算机系统结构:并行性、可扩展性、可编程性(王鼎兴等译,1995) (2)英文原版:Kai Hwang Zhiwei Xu, Scalable Parallel Computing Technology, Architecture, Programming (1998) 中译本:可扩展并行计算:技术、结构与编程(陆鑫达等译,2000) (3)英文原版:David E. Culler, Jaswinder Pal Singh, Anoop Gupta, Parallel Computer Architecture – A Hardware/Software Approach [Second Edition] (1996) (4) 英文原版:David A. Patterson, John L. Hennessy, Computer Architecture – A Quantitative Approach [Second Edition] (1996) 由于机器性能会随程序而变化,因此,应该在一定范围内或按调和分布来描述性能。 描述性能的一些术语和公式: 时钟频率: CPU是由一个恒定周期(τ,以ns表示)的时钟驱动。周期的倒数是时钟频率 f=1/τ,以MHz表示 CPI (Cycle Per Instruction) :一条指令的周期数。不针对某类指令,则表示给定的指令系统和综合程序的平均值。 系统属性:四个 指令系统结构 编译技术 处理机实现和控制技术 高速缓存与存储器层次结构 MIPS速率:每秒百万次,表示CPU的执行速度 MISP速率 = Ic / ( T × 106 ) = f / ( CPI × 106) = ( f × Ic ) / ( C × 106 ) C是执行已知程序所需的时钟周期总数。 3. COMA模型 COMA模型是NUMA模型的一种特例。由全部高速缓存组成全局地址空间,访问远程缓存是通过分布在各处理机上的高速缓存目录来进行的。图1-8 1.2.2 分布存储型多处理机 1. 系统由多个结点(由处理机、本地存储器、I/O设备组成的自治的计算机)通过消息传递网络互相连接. 2. 消息传递型多计算机的演变 第一代(1983-1987)基于处理机板技术,采用超立方体结构和软件控制的消息交换方法。(Intel Ipsc/1) 第二代(1988-1992)用网络连结的系统结构、硬件消息寻径、中粒度分布计算的软件环境。(Intel Paragon) 第三代(1993- )处理机与通信工 具在同一芯片上实现的细粒度多计算环境。(MIT J-Machine) 3. 消息传递型多计算机研究的重要问题 消息寻径方式 网络的流控制策略 死锁避免 虚拟通道 消息传递原语 程序分解技术 1.3 多向量机和SIMD计算机 1.3.1 向量超级计算机 向量计算机往往是在标量处理机与向量处理机的“混合物”,程序与数据由主机加载到主存储器; 全部指令由标量控制器译码,若是标量操作或程序控制操作则有标量处理机的标量功能流水线执行; 若是向量操作则送入向量控制器,由主存储器与向量功能流水线执行向量数据流。 1.3.2 SIMD超级计算机 1 SIMD模型 M=(N,C,I,M,R) 式中:N:机器的处理单元(PE-Processor Element)数 C:由控制部件(CU-Control Unit)直接执行的指令集,包括标量与程序流控制指令; I:由CU广播到所有PE进行并行执行的指令集,包括算逻运算、数据寻径、屏蔽操作、PE执行的局部操作; M:屏蔽方案集,把PE划分为允许操作与禁止操作两种子集; R:数据寻径功能集,互连网络中PE间通信所需的各种设置模式 济南大学 信息科学与工程学院 研究生课程 ?2009 张玉璘 高级计算机体系结构 高级计算机系统结构 这里的‘高级’其含义是指与本科教育中已经介绍的‘常规’的系统结构类型的区别,着重在模型、算法和并行处理上。 学习的困难: 概念性强,形式描述弱 面广,强调工程

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档