- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Advanced Computer Architecture 高级计算机系统结构 上海大学计算机学院 徐炜民 参考教材: (1)英文原版:Kai Hwang, Advanced Computer Architecture – Parallelism, Scalability ,Programmability (1993) 中译本:高等计算机系统结构:并行性、可扩展性、可编程性(王鼎兴等译,1995) (2)英文原版:Kai Hwang Zhiwei Xu, Scalable Parallel Computing Technology, Architecture, Programming (1998) 中译本:可扩展并行计算:技术、结构与编程(陆鑫达等译,2000) (3)英文原版:David E. Culler, Jaswinder Pal Singh, Anoop Gupta, Parallel Computer Architecture – A Hardware/Software Approach [Second Edition] (1996) (4) 英文原版:David A. Patterson, John L. Hennessy, Computer Architecture – A Quantitative Approach [Second Edition] (1996) 第一篇 并行性理论 目前,衡量超级计算(supercomputing)仍用习惯的方法(小时、作业、程序数、程序可移植性) 采用共享存储器的向量多处理器系统仍是主流(Cray Research, Fujitsu, IBM, Hitachi, NEC)。例如,1993年的C90用 16台处理器,Gigaflops=1610,9,500次/美元。 九十年代,RISC标量处理机可达5000次/美元。基于消息传递的多计算机系统可达到Teraflops。 从广义上讲,可扩展性反映了系统结构、算法、软件和环境之间的相互关系。它涉及到系统结构的通用性、可扩展性、可编程性、可实现性。 第一章 并行计算机模型 并行性在不同的处理级别中可表现为多种形式:先行方式、流水线方式、向量化、并发性、同时性、数据并行性、划分、交叉、重叠、多重性、重复、时间共享、空间共享、多任务处理、多道程序、多线程方式、分布式计算。 2.现代计算机组成:(图1-1) 现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。各种求解方法可能需要不同的计算资源,这与求解问题的性质有关。 由于机器性能会随程序而变化,因此,应该在一定范围内或按调和分布来描述性能。 描述性能的一些术语和公式: 时钟频率: CPU是由一个恒定周期(τ,以ns表示)的时钟驱动。周期的倒数是时钟频率 f=1/τ,以MHz表示 CPI (Cycle Per Instruction) :一条指令的周期数。不针对某类指令,则表示给定的指令系统和综合程序的平均值。 性能因子:五个Ic -已知程序的指令条数或指令计数,p -指令译码和执行所需的处理机周期数,m -所需的存储器访问次数,k -存储周期与处理机周期之比,k值与存储器技术及处 理机—存储器互连方法有关。存储周期比处理机周期τ大k倍。T -执行程序所需的CPU时间。一条指令执行的过程一般分为取指令、译码、取操作数、执行、存储结果五个阶段。其中译码和执行由CPU完成,称处理机周期;取指令、取操作数(有可能操作二次)和存储结果是对存储器操作,称存储器周期。T = Ic×CPI×τ = Ic×(p+m×k)×τ 系统属性:四个 指令系统结构 编译技术 处理机实现和控制技术 高速缓存与存储器层次结构 MIPS速率:每秒百万次,表示CPU的执行速度 吞吐率:系统在单位时间内能执行多少个程序 1.共享存储型多处理机: (1) 均匀存储器存取(UMA-Uniform Memory Access) UMA模型(图1-6)适用于多用户的一般应用和分时应用。它可以在限时应用中用来加快单个大程序的执行。所有处理器均匀(所谓均匀是指所有处理器对所有存储字具有相同的存取时间)共享物理存储器。各处理机之间的通信是通过共享存储器的共享变量来实现的。这一类多处理机由于对资源的高度共享,常称紧耦合系统(tightly coupled system)。系统互联常采用总线、交叉开关、多级网络。 对称多处理机系统(symmetric multi-processor) 所有
原创力文档


文档评论(0)