《并行计算:Parallel Computing》
结构 编程 算法 应用
§2.2 并行计算机性能测评
徐悦甡(Yueshen Xu)
ysxu@
软件工程系
西安电子科技大学
本节提纲
并行计算机访存模型
均匀存储访问与非均匀存储访问
高速缓存存储访问 从存储器的角度
非远程存储访问模型等
体系结构与访存模型的关系
并行计算机性能测评
并行计算机的基本性能指标 性能测评的后半部
加速比性能测评 分内容,很重要
可扩展性性能测评
2
并行计算机性能测评
上节课已讲
并行计算机性能测评概述
硬件层面或机器层面
程序层面或软件层面或算法层面
计算开销
硬件层面测试测评 通信开销
并行计算机 存储开销
性能测评
加速比性能测评
程序/软件层面测评
可扩展性测评
3
并行计算机性能测评
上节课已讲
CPU的部分通用性能指标
浮点运算数(FLOPS)
➢ 每秒浮点运算次数,floating-point operations per second,
FLOPS
➢ 原因:
- 1. 并行计算,特别是科学计算中大量使用浮点数,即小数
- 2. 浮点数运算比整数运算更花费时间,更有测量的意义与效果
执行时间 T
➢ T comput :计算时间,T paro :为并行开销时间,T comm :为相互通
信时间
T = T + T + T
n comput paro comm
4
并行计算机性能测评
上节课已讲
算法层面/程序层面性能评测
开始关注软件,而不是硬件
加速比性能评测
➢ 并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的
执行速度相对于串行算法(或串行程序)的执行速度加快了多少倍
➢ Amdahl 定律
➢ Gustafson定律
➢ Sun Ni定律
可扩展性评测
➢ 等效率度量标准
➢ 等速度度量标准
➢ 平均延迟度量标准
5
并行计算机性能测评
加速比
Amdahl 定律(阿姆达尔定律,固定负载)
➢ :处理器数
➢ :问题规模 (计算负载、工作负载,给定问题的总计算量等)
➢ :应用程序
原创力文档

文档评论(0)