多核程序设计专用课件.ppt

  1. 1、本文档共127页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多核程序设计专用课件

线程档案器实验——负载平衡问题(续2) 解决性能问题 回到Microsoft Visual Studio界面,观察源代码:在computePot函数中,每个线程用它分配的标识符(tid)来划分它要完成的任务块。然而,在内部的循环需要用到外部循环的索引作为结束条件。因此,外部循环的索引越大时,内部循环的迭代次数也越多,而相应划分到的线程所要完成的任务也越重。 有一个很好的方法能解决这种负载不平衡问题,即采用更灵活的任务分配机制。例如,不采用将连续的迭代分配给一个线程,而交叉分配给多个线程,比如只有两个线程时,可将奇数次的迭代分配给一个线程,而将偶数次的迭代分配给另一个线程。 按照上面提示的方法,修改源代码的任务分配机制,结合线程档案器,使程序的线程负载趋于平衡 * * * * * * * * * MPI群集通信(续2) 扩展的聚集和播撒操作 MPI_Allgather的作用是每一个进程都收集到其他所有进程的消息,它相当于每一个进程都执行了MPI_Gather执行完了MPI_Gather之后,所有的进程的接收缓冲区的内容都是相同的,也就是说每个进程给所有进程都发送了一个相同的消息。 int MPI_Allgather(void *sendbuf, int sendcount, MPI_Datatype sendtype, void *recvbuf, int recvcount, MPI_Datatype recvtype, MPI_Comm comm) MPI群集通信(续3) 全局交换 MPI_Alltoall的每个进程可以向每个接收者发送数目不同的数据,第i个进程发送的第j块数据将被第j个进程接收并存放在其接收消息缓冲区recvbuf的第i块,每个进程的sendcount和sendtype的类型必须和所有其他进程的recvcount和recvtype相同,这也意谓着在每个进程和根进程之间发送的数据量必须和接收的数据量相等。 int MPI_Alltoall(void *sendbuf, int sendcount, MPI_Datatype sendtype, void *recvbuf, int recvcount, MPI_Datatype recvtype, MPI_Comm comm) 解决负载均衡问题 稠密的矩阵与向量乘法运算是一个静态负载平衡的例子,假设矩阵为N×M阶,而有p个相同处理器可以用于计算,按行分解每个处理器分得 或 行,若干按列分解每个处理器分得 或 列。 M N 处理器0 处理器1 … … 处理器p-2 处理器p-1 多核程序设计 第八章多核软件工具介绍 2007年6月12日 C++编译器 英特尔C++编译器的主要功能与优点: 支持英特尔多核心处理器以及现有的英特尔处理器与体系结构,针对最新英特尔处理器的先进优化功能可以帮助产生出众的应用程序性能。 与针对 IA-32 的 Microsoft Visual C++、Microsoft Visual C++ 6.0 代码以及 Microsoft Visual C++ .NET 保持跨体系结构的兼容性。 针对最新英特尔处理器的先进优化功能可以帮助产生出众的应用程序性能。 Linux Windows 作用 -O0 /Od 禁止优化 -g /Zi 生成标记 -O1 /O1 优化二进制代码 -O2 /O2 优化速度(默认) -O3 /O3 优化数据缓存 C++编译器(续) 英特尔C++ 编译器支持以下语言标准: ANSI/ISO 标准,用于 C 语言编译 (ISO/IEC 9899:1990) ANSI/ISO 标准 (ISO/IEC 14882:1998) 用于 C++ 语言 OpenMP* 规范 2.5 版 英特尔C++编译器与其他常用工具保持兼容,可以集成到广泛使用的开发环境,并且同其他广泛使用的编译器保持着特性源与二进制方面的兼容性。 集成了 Microsoft Visual Studio 2005、Visual Studio .NET* 2002/2003 以及 Visual Studio 98 提供扩展 32 位和 64 位多核英特尔处理器支持。 C++编译器实验 实验要求 硬件 英特尔多核处理器 512 MB 内存 20 GB 硬盘 支持32位像素显卡 软件 Windows XP* SP2 Microsoft Visual Studio* .NET 2003 英特尔 C++ 编译器 9.0 或更高版本 英特尔 VTune性能分析器 7.2 或更高版本 英特尔 Thread Checker 线程检查器2.2 或更高版本 英特尔 Thread Profiler 线程档案器 2.2 或更高版本 实验代码

文档评论(0)

ustt001 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档