并行计算机体系结构-lec0performance.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PCA L5 Chp3.1 并行计算机体系结构 Lecture 5 Wu Spring 04 ? USTC Parallel Computer Architecture Overview ° Review of Lec4 ° Benchmark ° 性能提高(任务划分、分配、调度) PCA L5 Chp3.2 Wu Spring 04 ? USTC Review of Lec4 ° 并行计算机的性能评测 ° 加速比性能定律 ? 并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序 )的执行速度相对于串行算法(或串行程序)的执行速度加快了多少 倍。 ? Amdahl 定律 ? Gustafson 定律 ? Sun Ni 定律 ° 可扩放性评测标准 ? 等效率度量标准 ? 等速度度量标准 ? 平均延迟度量标准 PCA L5 Chp3.3 Wu Spring 04 ? USTC Overview ° Review of Lec4 ° Benchmark ° 性能提高(任务划分、分配、调度) PCA L5 Chp3.4 Wu Spring 04 ? USTC 程序级性能评测 ° 基准测试程序( Benchmark ) ? 一组标准的测试程序 ? 提供一组控制测试条件 ? 步骤的规则说明(测试平台环境、输入数据、输出结果和性能指标等 ) ° 基准测试程序的分类 ? 真实程序 : C compiler, Text editor, spice ? 核心程序 : Livermore 24 loops, Linpack ? 小测试程序 : 皇后问题、排序问题、求素数 ? 合成测试程序 : Whetstone 、 Dhrystone ? 应用:科学计算、商业应用、网络服务、多媒体应用 ? 宏观测试程序( Macro-benchmark ):计算机系统作为一个整体来测 试其性能 ? 微观测试程序( Micro-benchmark :测试机器的某一特定方面的性质 ° Benchmark Suites PCA L5 Chp3.5 Wu Spring 04 ? USTC 程序级性能评测( cont ‘ d) 类 型 宏观测试程序 名 称 PARKBENCH 并行计算 意 义 用 途 NAS SPEC Splash STAP TPC 微观测试程序 LINPACK LMBECH STREAM 并行计算 CFD 混合基准测试程序 并行计算 信号处理 商业应用 数值计算(线性代数) 系统调用和数据移动( UNIX ) 存储器带宽 PCA L5 Chp3.6 Wu Spring 04 ? USTC Whetstone 和 Dhrystone 测试程序 ° Whetstone : ? 浮点性能 合成测试程序 ? 最早用 Algol-60 写成,后用 Fortran 改写 ? 英国国立物理实验室最频繁使用的数值计算程序段。转换到称之为 Whetstone 虚拟计算机上的指令 ? 包括整数运算、浮点运算,涉及到数组下标索引、子程序调用、参数 传递、条件转移和三角 / 超越函数等,使用 Kwhetstone/s 数来度量。 ° Dhrystone ? 测试整数与逻辑运算性能合成测试程序 ? 用 Ada 、 C 和 Pascal 写成 ? CPU 密集( CPU-intensive )型测试程序,包括很多整型语句与逻辑 语句的小循环,使用 KDhrystone/s 数来度量 ? VAX11/780 ( 1MIPS) 的性能为 1.7KDhrystone/s ° Whetstone 和 Dhrystone 的缺点:它们不能预测用户程 序性能,对编译程序比较敏感。 PCA L5 Chp3.7 Wu Spring 04 ? USTC LINPACK 测试程序 ° Fortran 语言 求解线性代数方程组的子程序,于 1979 年 正式发布了 LinPACK 包 , 使用 BLAS1 ° 测试的基准是用全精度 64 位字长的子程序求解 100 阶线 性方程组的速度,测试的结果以 Mflops 机器名称 处理器数 R max ( Gflops ) N max (阶数) N 1/2 (阶数) R peak ( Gflops )

文档评论(0)

jinzhuang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档