[工学]哈工大并行计算课件第三章.ppt

  1. 1、本文档共191页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]哈工大并行计算课件第三章

哈尔滨工业大学计算机科学与技术学院 第3章 性能指标和基准程序 ?1 系统和应用的基准程序 ?2 性能和成本 ?3 基本性能指标 ?4 并行计算机性能 ?5 并行程序性能 ?6 可扩展性和加速比分析 如何描述应用和系统的性能特征? 什么是用户对性能和成本要求? 如何测量应用程序的性能? 使用何种类型的性能指标? 当在并行计算机上执行并行程序时,如何描述系统性能的特征? 影响性能的参数有哪些? 典型的参数值为多少? 如何量化和分析系统可扩展性? 如何确定执行给定应用问题的并行机的可扩展性? ?1 系统和应用的基准程序 一、前言 基准程序是性能测试程序,并假设它能刻划某一类应用问题的处理和数据移动的特征。 基准程序用来测量和预测计算机系统的性能,并能提示它们的体系结构的弱点和优点。 基准程序分类: (1)按应用类 (2)按计算机系统来分基准程序 宏基准程序 宏基准程序测量一个计算机系统的总体性能。 微基准程序两类 微基准程序测量一个计算机系统的某一特定方面性能。 二、微基准程序 包括:3个微基准程序组。 1.LINPACK 从1993起,美国明尼苏达大学和田纳西州立大学的Jack Dongarra 创作并加以维护。 高性能计算机TOP500项目,收集和维护关于世界上前500名最强大的计算机系统的信息,每年两次给出这些统计信息。 根据超级计算机的Linpack基准测试程序的性能进行排名。LINPACK简单实用,它定期公布有关各种系统的LINPACK性能数值表。 2004年6月TOPl0 2004年11月TOP10 2004年11月的最新TOP500的特点 DOE/IBM联合研发的BlueGene/L beta-System以实测Linpack峰值70.72TFlops位于2004年11月TOP500排名的第一位。当整个BlueGene/L系统完成时,将安装到DOE(能源部)下的Lawrence Livermore国家实验室。 紧跟其后的是安装在NASAAmes研究中心的SGl构建的Columbia系统,它的实测峰值是51.87TFlops。 上述两个系统让实测峰值35.86TFlops的日本NECEarthSimulator连续5次TOP500排名第1名成为历史。 该年度在TOP10中还有其他一些明显的变化。安装在Barcelona超级计算中心的IBMMareNostrum机群以20.53Tfops排名第四; 采用Apple Xserve服务器构建的Virginia TechX-system在六个月前由于主要的硬件更新出现了一些小问题退出TOP10后,现在以12.25TFlops重新回到了TOP10。 TOP10的系统最低Linpack峰值达到了10TFlops,TOP100的最低Linpack峰值从1.922TFlops升到了2.026TFlops,TOP500的最低Linpack峰值从6个月前的624.3GFlops提高到850.6GFlops,而最新的TOP500中最后一名六个月前还列310位 超过1TFlops的系统数量从242提高到399。 整个TOP500中所有的系统的性能总和,已经超过1PetaFIops,从六个月前的813TFlops突破到1.127PetaFlops。 另外从TOP500中可以发现一些变化趋势。从使用的处理器和系统类型来看,有320套系统采用Intel处理器,而六个月前这个数量是287,一年前只有189; 其次是IBM Power处理器(54), 然后是Hewlett-PackardPA-RISC处理器(48)和AMD处理器(31)。 结论: Intel的主导地位还是难以撼动 机群(cluster)系统是主要的系统类型,共有296套系统是机群 2.LMBENCH LMBENCH基准程序组由SGI的LarryMcVoy 提出,是一个可移植的基准程序。 在各种Unix平台上,用来测量操作系统开销和处理器、高速缓存、存储器、网络及磁盘。 3.STREAM 是一个简单的合成基准程序; 由SGl的JohnMcCalpin提出。 测量持续的存储器带宽(以MB/s为单位)和相应的计算速率。 下表中的向量a、b和c均是有二百万个元素的数组,其中每个元素是一个8字节的字。 McCalpin提出一个机器平衡指标,由下式定义: 4.说明(如下表所示): 许多系统的机器平衡值随年份增长而不断增加,意味着存储器带宽越来越落后于处理器速度。 IBM RS6000各种服务器是个例外,因为IBM公司对其中的存储器系统设计总是给予足够重视。 其他公司也尝试改进存储器系统性能。 三、并行计算的基准程序 测试分布共享存储器机器 数值计算基准程序 斯坦福大学开发的Splash和Splash-2; 并行化

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档