- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多GPU环境下三点相关函数算法研究计算机科学与技术专业论文
目 录
第一章 绪论1
1.1 研究背景1
1.2 国内外研究现状 2
1.3 本文主要研究工作和创新4
1.4 本文内容和结构 5
第二章 三点相关函数与多 GPU 计算环境相关背景综述 6
2.1 三点相关函数研究背景 6
2.1.1 相关函数背景6
2.1.2 三点相关函数6
2.1.3 三点相关函数的计算问题 7
2.2 基于递归卷积算法的三点相关函数算法7
2.2.1 标量域的递归卷积 7
2.2.2 近似三点相关函数求解 9
2.3 多 GPU 通用计算背景 11
HYPERLINK \l _TOC_250002 GPU 通用计算 11
HYPERLINK \l _TOC_250001 多 GPU 计算环境 12
HYPERLINK \l _TOC_250000 第三章 多 GPU 环境下三点相关函数算法设计 14
3.1 算法分析14
3.1.1 传统递归卷积算法分析 14
3.1.2 算法精度分析19
3.1.3 算法分析结论20
3.2 基于单 GPU 的并行三点相关函数算法设计 20
3.2.1 递归卷积步骤分析 20
3.2.2 单 GPU 算法主存显存通信问题研究 22
3.2.3 基于递归卷积的单 GPU 算法设计 22
3.3 基于 GPU 的算法优化 24
3.3.1 补 0 优化策略24
3.3.2 去 0 优化策略25
3.4 多 GPU 三点相关函数算法研究 26
3.4.1 单 GPU 算法分析 26
3.4.2 多 GPU 环境下的算法设计 26
第四章 实验结果与分析28
4.1 实验环境与实验数据 28
4.2 基于单 GPU 的算法实验结果与性能分析 28
4.2.1 实验结果 29
4.2.2 实验分析 29
4.3 两种优化策略的实验结果与分析 31
4.3.1 补 0 优化策略实验结果与分析 31
4.3.2 去 0 优化策略实验结果与分析 32
4.4 基于多 GPU 的算法实验结果与分析 32
4.5 计算性能与计算精度的综合分析 35
第五章 总结与展望 39
5.1 全文总结39
5.2 进一步的工作 39
参考文献 41
发表论文和参加科研情况说明 44
致 谢 45
第一章
第一章 绪论
PAGE
PAGE 10
第一章 绪论
1.1 研究背景
宇宙大尺度结构的研究对当前宇宙学和天体物理学具有重要意义:1、在甚 早期宇宙中,引发大尺度结构的原初扰动的物理诱发机制;2、随着宇宙的演化, 在引力以及其它气体物理作用下大尺度结构的形成以及相关演化。随着天文观测 技术的不断发展与进步,目前已经有海量数据可以供科研人员研究物理宇宙,比 如,SDSS 巡天提供了 105 个星系的测量数据[1][2][3],WMAP 则提供了 106 个点的 微波背景辐射温度测量数据[4],下一代巡天观测将可以测量比现在高 1 到 2 个数 量级的宇宙学观测对象(如 LSST,PLANCK,Pan-Stars 等等)。而与之相对的, 在我们现在所宣称的精确宇宙学时代,占主导地位的是仅仅测量两点相关函数或 者功率谱。从已经相当庞大的观测数据里提取出的两点相关函数或者功率谱,只 能提供仅仅数十个到数百个数据点,对于限制暗能量参数之类的目前流行的工作, 或许是足够的,但是对于全面理解早期宇宙的物理状态和后期演化是远远不够的, 因为有很多信息被忽略掉了。基于两点相关函数的现代大尺度结构研究以及相应 的宇宙学和天体物理学应用目前正处于一个瓶颈期,主要在于两点相关函数包含 的信息太少。而相关函数是天体物理学中应用非常广泛的一个统计函数,在大尺 度的空间结构中,较高阶的相关函数可以被用于验证一些关于宇宙的基础理论的 假说或猜想。研究者们已经意识到必须要用非高斯性包含的信息来丰富、改进、 提高我们对宇宙大尺度结构的认识,经过近三十年的发展,三点相关函数的计算、 理论和应用途径正在逐渐成熟起来[5]。
而三点相关函数的其中一个计算难点就是其计算的高复杂度,即计算性能问 题。对于一般的解法,随着点集规模的扩大,其计算时间呈平方甚至立方次增长, 即使使用其他优化算法,在点集规模较大的情形下,计算时间也会急剧增长[6]。 因此计算性能成为其主要研究瓶颈。
目前各个领域对高性能计算的需求越来越迫切。随着各行业中数据计算量的 增大及计算复杂度的增加,大量实际问题的求解过程在计算能力及计算速度方面 不断提出新的要求。因此,并行计算成为当今计算机科学中一个重要的研究领域。 而异构计算作为当前高性能计算中极具发展潜力的计算模式,已经成为并行计算 领域中的一个重要研究方向。其中,随着 GPU 通用计算[7]的普及,CPU 加 GPU 的异构计算模式已经成功应用于石油勘测、天
您可能关注的文档
- 产品市场竞争对信息披露影响的实证研究-数量经济学专业论文.docx
- 产品市场竞争影响企业社会责任的实证研究-会计学专业论文.docx
- 产品市场竞争对我国上市公司债务期限结构的影响研究-技术经济及管理专业论文.docx
- 产品平台衍生品数量的影响机制研究-企业管理专业论文.docx
- 产品平台知识共享和团队连续性对平台绩效的影响研究-企业管理专业论文.docx
- 产品市场竞争对自愿性信息披露的影响研究——基于我国民营上市公司的经验证据会计学专业论文.docx
- 产品开发与经营的投入产出比分析-企业管理专业论文.docx
- 产品开发与经营的投入产出比研究-企业管理专业论文.docx
- 产品开发流程与职能结构动态适配模式的研究-技术经济及管理专业论文.docx
- 产品开发风险分析与风险管理-工商管理专业论文.docx
- 多DSP目标检测软件设计与优化-模式识别与智能系统专业论文.docx
- 多LMA环境代理移动IPv6协议的研究和实现-信息安全专业论文.docx
- 多RFID单元RFID系统时间同步方法研究及其在智能建筑安全防范中的应用-市政工程专业论文.docx
- 多QoS约束下的流量调度技术研究与实现-计算机技术专业论文.docx
- 多下层双层线性规划的若干模型研究-运筹学与控制论专业论文.docx
- 多不饱和脂肪酸ω-3和ω-6对胃癌细胞侵袭影响的研究-普通外科学专业论文.docx
- 多业务IP承载网中QoS应用研究-计算机科学与技术专业论文.docx
- 多业务传输平台设备的以太网集成业务适配卡设计-电子与通信工程专业论文.docx
- 多业务安全校园网规划方案研究-计算机技术专业论文.docx
- 多业务承载宁夏电信IP城域网分析-电子与通信工程专业论文.docx
文档评论(0)