大规模计算机集群在地震勘探资料处理中的应用探讨.docxVIP

大规模计算机集群在地震勘探资料处理中的应用探讨.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

??

?

??

大规模计算机集群在地震勘探资料处理中的应用探讨

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

尹龙张卫华程实郭冶梁妍牛犇

摘要:随着“两宽一高”采集技术的应用,原始地震勘探数据呈指数级增长,数据体越来越大,结构越来越复杂,地震资料开始进入大数据时代。文章基于海量地震数据的资料处理特点,分析HPC技术趋势,探讨并设计适合自身需求的超大规模HPC集群。

关键词:大数据;高性能计算;地震数据;两宽一高

中图分类号:TP311文献标志码:A文章编号:1006-8228(2016)08-01-03

Abstract:Withtheapplicationof2W1H(wide-band,wideazimuthandhigh-density)acquisitiontechnologyinoilexploration,theoriginalseismicdataisgrowingexponentially,thedatavolumeisgettingbiggerandbigger,thestructureismoreandmorecomplex,seismicdatahasbeguntoenterthebigdataera.basedonthecharacteristicsofmassiveseismicdata,thispaperanalyzesthetrendofHPCtechnology,anddiscussesanddesignstheultralargescaleHPCsystemfittingforourowndevelopment.

Keywords:bigdata;HPC;seismicdata;2W1H

0引言

近几年来,随着勘探技术的不断进步,野外地震采集的精度在不断提高,“两宽一高”地震技术开始得到全面推广和使用。以我国某地为例,覆盖次数大于200次,高达数千次,横纵比为0.5-1,采用宽频可控震源激发,扫描频率大于5个倍频程[1]。相应地,东方地球物理公司研究院逐步完善了对高密度、宽方位数据资料配套的处理技术,形成多波多分量、三维连片、高密度宽方位数据处理等技术特色。方法有了,作为资料处理运行工具的高性能计算集群应如何设计,本文主要探讨这个问题。

1发展难点

高性能计算系统用于解决复杂的大量数据计算,如常用于石油勘探、分子模拟、天气预报等很多科学计算领域。高性能计算通常使用并行算法,即通过并行软件将数据及计算任务分解并分发到各个计算节点上完成计算,最后将计算结果进行汇总。因此,高性能计算系统要求有高计算性能、高I/O吞吐率、大规模数据存储及高可用性等特点[2]。

2012年,东方公司在海外油气勘探市场承接的十万道级别高效采集项目就已经进入实施,数十万道甚至百万道也在不远的将来实现。随之而来的是原始地震勘探数据呈指数级增长,数据体越来越大,结构越来越复杂,地震资料数据动辄几十甚至几百TB(如图1)。地震处理软件也在不断更新升级,陆续出现基于大规模甚至超大规模地震数据开发的地震资料处理模块。然而,超大规模的数据存储,超高性能的计算要求,再加上有限的项目周期,给地震资料处理带来巨大的挑战。在进行高性能计算资源管理设计时,不但要考虑能满足PB级数据存储和吞吐能力,还要设计和构建能够处理大规模的高性能计算集群系统。

2超算集群系统设计

2.1CPU+GPU协同工作

协同工作是将CPU和GPU两种不同架构的处理器组成在一起,通过程序让其协同工作。为了追求通用性,CPU将其中大部分晶体管主要用于控制单元(比如分支预测等)和存储单元(Cache),只有少部分的晶体管来完成实际的运算工作(如图2),因此CPU在逻辑判断、非线性寻址等复杂逻辑运算有非常高的效率[3]。而GPU最初是为了完成图形处理,因此它的更多单元用于执行计算,这也让GPU更加适合密集型的计算任务,随着硬件技术的发展,GPU的计算能力已经远远超出了其自身图形功能,同时GPU的可编程性也让其完成浮点计算的科学研究逐渐活跃起来。从图3可以知道,在浮点计算方面GPU的计算能力已经远远优于CPU。

GPU参与的运算应用有如下特征:

⑴运算密集性;

⑵高度并行性;

⑶控制简单性。

从目前来看,单纯使用CPU进行大规模计算已经不再拥有吸引力,更为科学的是采用CPU+GPU协同工作,由CPU负责执行复杂的逻辑处理和事务处理,GPU负责计算密集型的大规模数据计算。这种利用GPU强大处理能力和高带宽而弥补单纯使用CPU计算时性能不足的计算

文档评论(0)

133****6472 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档