翻译英文文献Cosmological calculations on the GPU.docxVIP

翻译英文文献Cosmological calculations on the GPU.docx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
翻译英文文献Cosmological calculations on the GPU

图形处理器的宇宙运算D. Barda.*,M. Bellis b,c,1,M.T. Allenad, H. Yepremyane, J.M. kratochvilfa卡福利粒子天体物理和宇宙学院,斯坦福,加利福尼亚,94309,美国b物理天文系,锡耶纳学院,罗顿威尔,纽约,12211,美国c物理系,北伊利诺伊州大学,迪卡尔布,伊利诺伊州,60115,美国d物理系,斯坦福大学,斯坦福,加利福尼亚,94309,美国e福特希尔学院,圣克拉拉,加利福尼亚,94022,美国f物理系,迈阿密大学,弗洛里达,弗洛里达州,33143,美国摘要宇宙测量需要非同寻常的数据量,远远超过普通的数据集合。下一代观测望远镜将会产生数以亿计的星系的测量数据值。这些数据集合的规模以及所含计算的本征将会使得宇宙计算在图像处理器的实现达到理想的模式。我们考虑两种宇宙的计算,分别是两点式角相关函数以及孔径质量统计,通过在图像处理单元上构建代码计算它们,达到提高计算速度的目的。使用计算机统一设备架构,我们在GPU上实现了两种算法,并且将它的运行速度和在中央处理器上的运行速度进行比较。相比较于在CPU执行相同计算的运行时间,我们的代码运行速度快了10-100倍。这些代码已经得到公开。GPUS对于宇宙运算而言,是一个有用的工具,甚至是目前调查的数据集合的大小,我们仍使得计算速度得到了两个数量级的提高。关键词:宇宙计算孔径质量角相关函数图像处理器计算机统一设备架构科学计算宇宙学引言在科学计算领域,图像处理器的应用和其他不同的学科领域一样,比如生物信息学,质量检查处的晶格计算和地震学(见例,吴等人(2012),卡多索和比卡多(2011),冈本等人(2010)),得到了稳步的增长,在天文学领域,GPUs在许多不同密集型计算难题都被证实有很好的应用价值,例如N-人体仿真(波多夫等人2012;纳塔多里和阿塞夫等人2012),射电天文观测(克拉克等人,2011)。GPU技术对于这些计算难题得到了100%成功的应用。在这项工作中,我们发现在宇宙数量的运算方面的时间同样能得到一个相似的减少。下一代的大规模天文观测(比如黑暗能源观测2,盘星3,大型气象观测望远镜)对于数以亿计的星球和星系的测量,将会产生数量巨大的数据。随之而来产生的难题,包括处理这些数值巨大的数据量以及如何构建和存取这些囊括了十几个兆字节信息的数据库,在这篇文章中都得到了详细的研究和讨论。(比如方法,2011:贝里曼和格鲁姆,2011:布拉纳等人2001)。在这篇论文中,我们处理了作为一个天文学家将会遇到的挑战——一旦从中央数据库中得到信息,尝试着如何去分析它们。拥有这样一个大数据量,在很多宇宙数量的统计不确定性比起目前的有限的水平将会有几个数量级的减小。但是为了充分利用这些数据,新处理方法必须得到改进。现今的用来计算宇宙的数量的方法倾向于复杂度O(n2)(其中n是数据点的个数),显然这是不能满足于未来数以亿计的数据观测值的要求,即使计算机硬件水平有了很大提高。许多宇宙计算需要所有数据点同样数量的独立计算,这就使得天成为并行运算的理想计算方式(其中每项运算被分包给不同的处理设备)。在过去,这些是由处于一个计算集群环境的不同CPUs来处理的,但是建立这些群和在这些系统上争取时间对于研究者来说将会是很大代价。GPU处理方式给台式机的处理速度带来了很大提高,因此它也适用于个体分析。随着GPU计算在更广阔的天文领域得到了发展和更为广泛的应用,即使现有的计算水平有限,但是在不久的将来,我们将会看到它的实现。在这篇论文中,我们使用计算机统一设备架构编程语言(尼科尔斯等人,2008),描述了在这些宇宙计算的两种图像处理器的实现方式,即两点式角相关函数以及孔径质量分析。宇宙中大规模结构对于宇宙物质的组成和演化是一个极其有价值的探索。这些结构能够被用来娴熟宇宙的模型。星系对于宇宙中所有物质是很好的示踪剂。尽管我们只能够直接探测发光物质,星系形成于黑暗物质的浓缩。我们因而能够描述出宇宙中物质的大规模结构,通过使用角相关函数测量得不同尺寸范围的星系的集聚。两点式角相关函数(傅立叶空间的物质的功率谱)是基于星系数量,并且测量作为一个独立单元后的成对星系的增益或者损耗,相对于一个随机分布而言。在小范围以内(近似等于100h-1的百万秒差距),我们能够测量出声波在重组时重子声学震荡的痕迹。从大范围而言,物质的功率谱并没有被辐射或者重子所影响,所以它是原始波动和膨胀一个罕见的探测。见巴赛特和霍尔特克(2009)的关于这个学科的完整评论,皮布尔斯(1980)描述了宇宙中大规模结构和克尔等人(2005),爱因斯坦等人(2005)对于重子声学振荡的第一次测量。计算难以计数星系的一个角相关函数,并且分立范围从角秒到度,需要非同寻常的处理功率,而它是以星系数目

文档评论(0)

ipad0c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档