- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验室周报告.ppt
实验室周报告 刘尧 2017.10.13 矩阵存取顺序 在科学计算中,经常遇到多维数组、矩阵或者类矩阵结构。数据访问是一个关键问题: 基于cache行的内存布局和任何多维数据结构间的映射必须与数据读取与存储的顺序相配。 间隔 N 访存 1 do i=1, N do j=1, N A(i, j)=i*j end do 5 end do 间隔 1 访存 1 for (i=0; iN; ++i) { for (j=0; jN; ++j) { a[i][j]=i*j; } 5 } Fortran语言代码示例 C语言代码示例 (1,1) [ (1,2) (1,3) (1,4) (1,5) [ ] (2,1) (2,2) (2,3) (2,4) (2,5) (3,1) (3,2) (3,3) (3,4) (3,5) (4,1) (4,2) (4,3) (4,4) (4,5) (5,1) (5,2) (5,3) (5,4) (5,5) 矩阵按列存储策略 Fortran语言使用这种策略。 在内存中矩阵列被连续存储 假定cache行包含四个矩阵元素(使用中括号表示) [ ] [ ] [ ] [ ] [ ] [0] [0] [ [0] [1] [0] [2] [0] [3] [0] [4] [ ] [1] [0] [1] [1] [1] [2] [1] [3] [1] [4] [ ] [2] [0] [2] [1] [2] [2] [2] [3] [2] [4] [ ] [3] [0] [3] [1] [3] [2] [3] [3] [3] [4] [ ] [4] [0] [4] [1] [4] [2] [4] [3] [4] [4] [ ] [ ] 矩阵按行存储策略,C语言使用这种策略。在内存中矩阵行被连续存储 假定cache行包含四个矩阵元素(使用中括号表示) 计算并行性 数据并行性 功能并行性 数据并行性 科学计算中许多问题都涉及大量实验数据的处理,如果计算可以被并行执行,即多处理器的不同的数据上进行并行计算,则称为数据并行。 P1 P2 do i=1, 500 a(i)=c*b(i) end do do i=501, 1000 a(i)=c*b(i) end do do i=1, 1000 a(i)=c*b(i) end do 循环中的所有迭代分布到两个处理器P1和P2上并行执行 通信开销与数据依赖 通信开销的计算与数据依赖的局部性密切相关。通信开销随着信息传递路径的增加而线性增加。 比如为了得到某个量相对于坐标的一阶或二阶导数,仅需要相邻子域信息,一般是宽度为1的通信层。 二维Jacobi区域 二维Jacobi区域行块划分分解算法 区域分块算法最优通信情况 区域分解方法的优势之一是如果问题规模增长N倍则域边界比域容量增长慢这种分解方法解决问题规模扩大时通信瓶颈的问题 功能并行性 一个庞大的数值问题的求解可以分为许多个相互独立的子任务,子任务之间是通过数据交换和同步协同工作的,这些子任务在不同的数据集上执行不同的代码。 当不同的子任务有不同的性能特征或者不同的硬件需求时,容易导致性能瓶颈或负载不均衡等问题。 功能并行就是给不同的核分配不同类型的任务 负载不均衡 在提高并行效率时,侧重点都在硬件细节和所采用的并行方法的缺点与不足上(如通信开销、同步丢失、带宽瓶颈等),而负载不均衡往往被忽略。 大量资源没有充分利用 时间 work work work work wait wait wait 同步点 资源低效利用只有一个,可接受 时间 work work work work wait 同步点 为了更好的解决功能并行化问题,需要进行小规模模拟实验,通过任务监测和分配策略的调整来实现最优后,再进行规模扩展的模拟计算。 能源领域超算项目的研究 针对能源领域中,地质数据的各向异性介质,研究面向E 级计算平台研究适合大规模三维地震资料处理的各向异性数据时的模块分解; 如何充分利用E 级计算机的强大计算能力,解决大规模三维实际地震资料应用的计算瓶颈问题,是本项目的研究重点。 弹性波模拟流程 基于C语言,以MPI为节点间并行方法,主要在偏移和正演的单炮层次上实现粗粒度并行; 以OpenMP为节点内多GPU协同并行方法,实现节点内基于GPU计算的中等粒度的并行; 以OpenMP为并行方法,在差分运算、成像等具体实现环节实现的CPU并行运算; 在差分运算、成像等具体环节实现基于GPU多核的并行运
您可能关注的文档
最近下载
- 家电采购售后服务计划.docx VIP
- DB65 红枣果树越冬冻害等级划分.docx VIP
- 全过程造价咨询服务方案(1).docx VIP
- DB65森林生态系统服务功能监测与评估数据管理规范.docx VIP
- 最新-《注册岩土工程师执业资格考试基础考试复习教程》.pdf VIP
- DB65 干旱区砂土枣树井式节水灌溉技术规程.docx VIP
- DB65 农业机械卫星导航自动驾驶技术应用规范.docx VIP
- 合同纠纷的法律意见书(3篇).docx
- GGS54301-2015景观工程类供方管理标准.pdf VIP
- QCR 749.3-2020铁路桥梁钢结构及构件保护涂装与涂料 第3部分:附属钢结构(OCR).pdf VIP
文档评论(0)