scalasca 13用户手册--中文.doc

下载文档 降价啦

128
0
约4.68万字
约 43页
2017-12-07 发布于江西
举报
版权申诉
保障服务

scalasca 13用户手册--中文.doc

1、本文档共43页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

scalasca 13用户手册--中文

scalasca 1.3 用户手册 1 引言 1 1.1 如何阅读本文档 1 1.2 性能优化周期 1 1.3 Scalasca概述 2 2 入门指南 4 2.1 插桩 4 2.2 运行时测量收集与分析 5 2.3 分析报告审查 6 2.3.1 CUBE3的使用 6 2.4 一个完整的工作流程例子 7 3. 应用插桩 12 3.1 自动编译器插桩 13 3.2 手动区域插桩 14 3.3 半自动插桩 15 3.4 使用PDTOOLKIT进行自动源代码插桩 16 3.4.1 限制 17 3.5 选择插桩 18 4. 测量收集与分析 19 4.1 NEXUS配置 19 4.2 测量配置 20 4.1.2 基于编译器插桩的子程序过滤 20 4.2.2 选择性MPI事件生成 20 4.3 硬件计数器度量参数的测量与分析 21 4.4 自动并行事件痕迹分析 22 4.5 自动串行事件痕迹分析 23 5. 辅助工具 25 5.1 辅助EPILOG事件痕迹工具 25 5.2 痕迹转换器 25 5.3 用户指定的虚拟拓扑记录 25 附录A：MPI包联系 27 A.1 函数到组 27 A.2 组到函数 34 参考文献 41 1 引言超级计算是现代科学与工程的关键技术之一，是解决高复杂度关键问题不可缺少的。作为当今大规模计算系统生产应用的先决条件，高性能计算机需要强大而健壮的性能分析工具，这些工具能够优化并行应用使之更有效、更高效。 Scalasc是一个由Jülich超算中心开发的性能分析工具集专门设计用于包括IBM Blue Gene 和 Cray XT等大规模系统，它也适用于使用MPI和/或OpenMP的较小的高性能计算平台。Scalasca支持一性能分析采用测量配置，通过事件跟踪将行为的与运行时摘要结合。Scalasca的特征是识别如工作分布不均衡的等待状态。特别是当试图测量处理器数的通信集约应用时，这些等待状态对好的性能可能是严峻的挑战。与它的前身KOJAK相比，Scalasca可以发现这些等待状态，即使在使用一个新的并行跟踪分析模式的很大的过程配置中。 1.1 如何阅读本文档 1.2 性能优化周期为单核性能，应用优化的基本途径是很相似的。首先，应用的行为必须被监测，然后可以评估记录下来的行为并得出进一步改进的结论。这是一个迭代过程，可以用一个周期来描述，称作性能优化周期。它下列部分组成：插桩（Instrumentation）测量（Measurement）分析（Analysis）表示（Presentation）评估（Evaluation）代码优化（Optimization of the code）图1.1 性能优化周期如图1.1所示，用户以原始（未优化）的应用开始，进入优化周期的“插桩”阶段。插桩描述修改应用程序代码的处理过程，使得能够在应用运行期间对性能相关数据进行测量。Scalasca可以通过不同的机制来完成这一工作。如源代码插桩、基于编译器的自动插桩和连接预插桩库。源代码级插桩可以通过引入附加指令到源代码中来实现。大多数系统中，插桩工作可以通过使用编译器的专门特征自动完成，但是这种方法通常不允许进行细粒度的插桩控制。第三种方法是使用预插桩库，预插桩库中含有已插桩的相关库函数的实现。消息传递接口标准MPI提供了用于这种插桩的专门接口，称作PMPI接口。由于这种接口被定义在MPI标准中，因此它的API是轻量的，并且为工具开发者创造了一个为多种不同的MPI实现提供单一轻量级测量库的机会。当被插桩代码在测量阶段执行时，性能数据被收集。这些数据可以依据期望的信息需求级别存储为概要描述或事件跟踪。插桩期间被插入的额外指令及关联的测量存储需要一些资源（内存以及CPU时间）。因此应用的执行会受到一定程度的影响。由额外测量指令产生的干扰很小，足以获取应用程序行为的精确视图。然而，某些应用属性，如极小时间内频繁执行的区域，将总是导致高的干扰。因此必须避免对这些区域的测量。应用执行之后可以分析测量数据。如果已经收集了详细的事件跟踪，可以研究不同进程产生的事件间更复杂的依赖，生成更详细的分析报告。特别是交互进程事件的相互关系通常只能通过事后检查分析进行。用于分析这些相互关系的信息通常分布在这些进程中。测量期间应用程序运行过程中的数据传输将引起严重干扰，为此将需要一些网络应用资源。收集的数据被分析后，结果需要表示在一个分析报告中，从而转入性能优化周期的下一阶段，称作表示阶段。在这一阶段，重要的是简化收集的性能数据的复杂性以便用户容易评估。如果呈现的数据太抽象，关键性能事件可能不能被用户识别，如果太详细，用户可能被淹没在大量数据中。因此为用户产生应用优化的指导是关键。评估阶段的结论是由表示的信息产生优化意向。用户对应用的优化策