多GPU环境下三点相关函数算法研究计算机科学与技术专业论文.docxVIP

多GPU环境下三点相关函数算法研究计算机科学与技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多GPU环境下三点相关函数算法研究计算机科学与技术专业论文

目 录 第一章 绪论1 1.1 研究背景1 1.2 国内外研究现状 2 1.3 本文主要研究工作和创新4 1.4 本文内容和结构 5 第二章 三点相关函数与多 GPU 计算环境相关背景综述 6 2.1 三点相关函数研究背景 6 2.1.1 相关函数背景6 2.1.2 三点相关函数6 2.1.3 三点相关函数的计算问题 7 2.2 基于递归卷积算法的三点相关函数算法7 2.2.1 标量域的递归卷积 7 2.2.2 近似三点相关函数求解 9 2.3 多 GPU 通用计算背景 11 HYPERLINK \l _TOC_250002 GPU 通用计算 11 HYPERLINK \l _TOC_250001 多 GPU 计算环境 12 HYPERLINK \l _TOC_250000 第三章 多 GPU 环境下三点相关函数算法设计 14 3.1 算法分析14 3.1.1 传统递归卷积算法分析 14 3.1.2 算法精度分析19 3.1.3 算法分析结论20 3.2 基于单 GPU 的并行三点相关函数算法设计 20 3.2.1 递归卷积步骤分析 20 3.2.2 单 GPU 算法主存显存通信问题研究 22 3.2.3 基于递归卷积的单 GPU 算法设计 22 3.3 基于 GPU 的算法优化 24 3.3.1 补 0 优化策略24 3.3.2 去 0 优化策略25 3.4 多 GPU 三点相关函数算法研究 26 3.4.1 单 GPU 算法分析 26 3.4.2 多 GPU 环境下的算法设计 26 第四章 实验结果与分析28 4.1 实验环境与实验数据 28 4.2 基于单 GPU 的算法实验结果与性能分析 28 4.2.1 实验结果 29 4.2.2 实验分析 29 4.3 两种优化策略的实验结果与分析 31 4.3.1 补 0 优化策略实验结果与分析 31 4.3.2 去 0 优化策略实验结果与分析 32 4.4 基于多 GPU 的算法实验结果与分析 32 4.5 计算性能与计算精度的综合分析 35 第五章 总结与展望 39 5.1 全文总结39 5.2 进一步的工作 39 参考文献 41 发表论文和参加科研情况说明 44 致 谢 45 第一章 第一章 绪论 PAGE PAGE 10 第一章 绪论 1.1 研究背景 宇宙大尺度结构的研究对当前宇宙学和天体物理学具有重要意义:1、在甚 早期宇宙中,引发大尺度结构的原初扰动的物理诱发机制;2、随着宇宙的演化, 在引力以及其它气体物理作用下大尺度结构的形成以及相关演化。随着天文观测 技术的不断发展与进步,目前已经有海量数据可以供科研人员研究物理宇宙,比 如,SDSS 巡天提供了 105 个星系的测量数据[1][2][3],WMAP 则提供了 106 个点的 微波背景辐射温度测量数据[4],下一代巡天观测将可以测量比现在高 1 到 2 个数 量级的宇宙学观测对象(如 LSST,PLANCK,Pan-Stars 等等)。而与之相对的, 在我们现在所宣称的精确宇宙学时代,占主导地位的是仅仅测量两点相关函数或 者功率谱。从已经相当庞大的观测数据里提取出的两点相关函数或者功率谱,只 能提供仅仅数十个到数百个数据点,对于限制暗能量参数之类的目前流行的工作, 或许是足够的,但是对于全面理解早期宇宙的物理状态和后期演化是远远不够的, 因为有很多信息被忽略掉了。基于两点相关函数的现代大尺度结构研究以及相应 的宇宙学和天体物理学应用目前正处于一个瓶颈期,主要在于两点相关函数包含 的信息太少。而相关函数是天体物理学中应用非常广泛的一个统计函数,在大尺 度的空间结构中,较高阶的相关函数可以被用于验证一些关于宇宙的基础理论的 假说或猜想。研究者们已经意识到必须要用非高斯性包含的信息来丰富、改进、 提高我们对宇宙大尺度结构的认识,经过近三十年的发展,三点相关函数的计算、 理论和应用途径正在逐渐成熟起来[5]。 而三点相关函数的其中一个计算难点就是其计算的高复杂度,即计算性能问 题。对于一般的解法,随着点集规模的扩大,其计算时间呈平方甚至立方次增长, 即使使用其他优化算法,在点集规模较大的情形下,计算时间也会急剧增长[6]。 因此计算性能成为其主要研究瓶颈。 目前各个领域对高性能计算的需求越来越迫切。随着各行业中数据计算量的 增大及计算复杂度的增加,大量实际问题的求解过程在计算能力及计算速度方面 不断提出新的要求。因此,并行计算成为当今计算机科学中一个重要的研究领域。 而异构计算作为当前高性能计算中极具发展潜力的计算模式,已经成为并行计算 领域中的一个重要研究方向。其中,随着 GPU 通用计算[7]的普及,CPU 加 GPU 的异构计算模式已经成功应用于石油勘测、天

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档