第3章_性能指标和基准程序 第3节 基本性能指标 并行处理与体系结构教学课件.pptVIP

  • 1
  • 0
  • 约小于1千字
  • 约 11页
  • 2018-06-13 发布于贵州
  • 举报

第3章_性能指标和基准程序 第3节 基本性能指标 并行处理与体系结构教学课件.ppt

第3章_性能指标和基准程序 第3节 基本性能指标 并行处理与体系结构教学课件

哈尔滨工业大学计算机科学与技术学院 并行处理与体系结构 第3章 性能指标和基准程序 ?1 系统和应用的基准程序 ?2 性能和成本 ?3 基本性能指标 ?4 并行计算机性能 ?5 并行程序性能 ?6 可扩展性和加速比分析 一、工作负载和速度指标 常用3个指标来测量程序C的计算工作负载: 执行时间; 执行的指令数; 执行的浮点操作数。 关于指令数的说明 关于执行时间的说明 执行时间依赖于许多因素: 算法 数据结构 输入数据 平台 语言 浮点数 例题:FFT处理的利用率 假定STAP一个DP(多普勒处理)步由2048个,每个为8192点的FFT所组成。每个N点FFT处理的工作负载为W=5NlogN flop。 则多普勒处理步的总工作负载是2048x(5x 8192xlog 8192)flop,约为1.09Gflop。 对于在X机上50s的执行时间,其速度约为22Mflop/s。 假设X机的峰值速度为266Mflop/s,则多普勒处理可达到的利用率为 22/266=8.27% 仅为峰值性能的很低比值。 在进行理论性能分析时,常假设每条指令或flop需要相同时间量。 在实际系统中这种均匀速度假设是不成立的。 在单IBM SP2结点上,观察到的速度可从5变化到250Mflop/s。 在测量工作负载时,也广泛使用顺序执行时间以补充统计flop或指令数的方法 二、有关性能指标的总结 所

文档评论(0)

1亿VIP精品文档

相关文档