高性能计算论课件第二章PPT.ppt

高性能计算论课件第二章PPT.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高性能计算论课件第二章PPT

一次浮点数加法花费7纳秒时间,但是,当执行for循环时,可以在比较x[0]和y[0]指数时取出x[1]和y[1]。 更一般地说,能够同时执行7条指令的7个不同阶段。 * 总的来说,k个阶段的流水线不可能达到k倍的性能提高。例如,如果各种功能单元的运行时间不同,则每个阶段的有效运行时间取决于最慢的功能单元。 * 流水线通过将功能分成多个单独的硬件或者功能单元,并把它们按顺序串接来提高性能。而多发射处理器通过复制功能单元来同时执行程序中的不同指令。 例如,假设有两个完整的浮点数加法器,则计算下面循环所需要的时间减半: 当第一个加法器计算z[0]时,第二个加法器计算z[1];当第一个加法器计算z[2]时,第二个计算z[3];以次类推。 * 一个简单的例子,在下面的代码中,系统预测z=x+y的结果z可能为正数,因此执行赋值操作w=x。 预测执行允许预测错误的情况发生。如果z=x+y的值为负或者为零,需要回退机制,然后执行w=y。 如果预测工作由编译器来做,那么它通常在代码中嵌入测试语句来验证预测的正确性,如果预测错误,就会执行修正操作。假如由硬件做预测操作,处理器一般会将预测执行的结果缓存在一个缓冲器中。如果预测正确,缓冲器中的内容会传递给寄存器或者内存;如果预测错误,则缓冲器中的内容被丢弃,指令重新执行。 * * 在并行计算中,Flynn分类法经常用来对计算机体系结构进行分类。按照它能够同时管理的指令流数目和数据流数目来对系统分类。因此典型的冯·诺依曼系统是单指令流单数据流系统,因为它一次执行一条指令,一次存取一个数据项 * * * * * * 本章小结 串行系统 计算机硬件的标准模型是冯·诺依曼结构. 并行硬件 Flynn 分类法. 并行软件 我们关注同构MIMD系统的软件开发。此类系统的大部分程序是单个程序,并通过分支语句实现并行. SPMD 程序. * 本章小结(2) 输入和输出 我们会编写的程序是,其中的一个进程或线程可以访问标准输入(stdin),所有进程可以访问标准输出(stdout)和标准错误输出(stderr). 然而,由于不确定性,除了调试输出外,通常只让一个进程或线程访问标准输出(stdout). * 本章小结(3) 性能 加速比 Speedup 效率 Efficiency Amdahl’s law 可扩展性 Scalability 并行程序设计 Foster 方法 * 第二章作业(课本习题) * 分组 题目 分组 题目 1 1,2 8 14、15 2 3,4 9 16 3 5 10 17 4 6,7 11 19、20 5 8,9 12 21、22 6 10,11 13 23 7 12,13 14 24 要求:每个小组成员合作完成,做成PPT(包括题目、思路、答案)在课堂上讲解演示(时间:11月7号)。 * * 程序是一个接一个的输入到这台电脑,然后输出。传统的串行硬件和串行软件一次只执行一任务。 * “经典”的冯·诺依曼结构包括主存、中央处理单元(Central Processing Unit,CPU)处理器或核,以及主存和CPU之间的互连结构。 冯·诺依曼机器一次执行一条指令,每条指令对一个数据进行操作。 * * 到2010年,CPU执行指令的速度是从主存中取指令速度的100多倍。 为了更好地理解这个问题,我们可以想象一个大型企业在某个镇上有一个工厂(CPU),在另一个镇上有一个仓库(主存)。在工厂和仓库之间只有一条双车道公路。生产产品所需的原材料都存储在仓库中,所有的制成品在交付给客户前也存储在仓库中。如果产品生产的速度远大于原材料和产品运输的速度,那么就会出现交通堵塞,工厂的工人和机器要么时不时地空闲,要么就降低生产速度。 * 操作系统(Operating System,OS)是一种用来管理计算机的软件和硬件资源的主要软件。它决定什么程序能运行以及什么时候运行。 当用户运行一个程序时,操作系统创建一个进程。进程是运行着的程序的一个实例。 * 线程可以使用相同的可执行代码,共享相同的内存和相同的I/O设备。 * 如果进程是执行的“主线程”,其他线程由主线程启动和停止。当一个线程开始时,它从进程中派生(fork)出来;当一个线程结束,它合并(join)到进程中。 * 缓存是解决冯·诺依曼瓶颈而最广泛使用的方法之一。 CPU Cache 是一组相比于主存,CPU能更快速地访问的内存区域。一般来说,对高速缓冲存储器(cache,简称缓存)的访问时间比其他存储区域的访问时间短。 * 有了Cache后,一个很明显的问题是什么样的数据和指令能够存储在Cache中。通用的准则基于下面的原理: 程序接下来可能会用到的指令和数据与最近访问过的指令和数据在物理上是邻近存放的。 在执行完一条指令后,程序通

文档评论(0)

130****9768 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档