- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行集群环境下
迭前时间/深度偏移作业的运行效能研究
大庆油田有限责任公司勘探开发研究院 冯保民魏锐李建霞
集群技术应用现状
地震数据处理领域一直是高性能计算服务器应用的重要领域。基于队架构的高性能集群并
行机是伴随着计算机芯片技术、网络技术、系统集成技术和Linux的发展而出现的新产品。这些高
性能集群并行机主要应用于地震数据处理、全三维可视化数据体解释、油藏模拟计算,尤其在三维
叠前深度偏移及高分关辨率地震资料处理得到了很好的应用,高性能集群并行机和三维叠前深度
偏移理论的发展,极大地提高了复杂地质构造的地震资料的成像持量和油气勘探目标的准确识别,
成为了三维叠前深度偏移及高分辨率地震资料处理的首选平台。二oO三年,大庆油田公司研究
目前,已经完成了1500kin2三维迭前深度偏移处理任务,实现了实际地震资料处理的工程化。
二 影响偏移作业运行效能的因素及保障作业稳定运行方案
三维迭前深度偏移工作大致分为三个阶段:预处理、提取速度建立模型、偏移。从工作方式上
三个阶段的差别是:预处理为单节点批量处理;速度建模为单节点交互处理;时间偏移和深度偏移
为多节点并行批量处理。从作业运行时间上,三个阶段的差别是:预处理作业用时少,单作业时间
一般不超过一两天;速度建模则为处理解释人员的人工劳动;偏移阶段根据数据体大小,短则两周,
长则一到两个月。偏移阶段的特点是:一次分发任务给上百个节点,这些节点同时参与并行计算。
当第一次分发的数据在所有计算节点上全部计算完成后,主节点回收结果数据并进行第二次数据
分发,直至作业结束。在这个循环过程中,如果其中某个节点出现问题,则会导致节点计算速度慢,
造成其它节点的等待,直到该节点处理完当前任务,回收后才进行下一次任务的分发。所以在确保
并行各节点正常稳定工作的同时,应避免某一节点因用户访问数目过多或提交其他作业争夺系统
资源而导致该节点计算速度缓慢,造成集群并行系统整体性能下降,如我们后面要重点介绍的屏蔽
其它用户对偏移作业运行节点访问就是通过保证该节点用户数目的合理性方面,来提升系统整体
性能的实例。
影响偏移作业运行效能的因素有网络延迟、CPU速度、内存大小、倍频参数、死进程、文件系统
限制、临时交换区、系统负载等。
工作中我们分析了影响偏移作业运行效能的主要因素并摸索出一套行之有效的方案避免了上
述问题的发生,保障了作业的稳定运行。
保障作业稳定运行、提高效能的方案:
(1)在大偏移作业提交之前,彻底清除用户死进程和系统死进程。保证正常的系统初始环境。
(2)检查所有计算节点的CPU数、倍频参数、内存大小是否一致。
(3)检查所有计算节点的临时空间是否满足计算需要,删除无用的文件,释放更多的缓冲空间。
(4)检查所有计算节点的管理网络和计算网络是否畅通,有无延迟时间太长的节点。
(5)检查所有计算节点是否存在文件大小限制问题。
一77—
(6)屏蔽其它用户对偏移作业运行节点的访问,使作业在运行期间不受其它干扰。
(7)重点监控参与偏移任务的节点机的关键性能指标的变化趋势,如温度、风扇速度,及时评
估节点运行状态,做好故障处理预案。
(8)记录、统计计算节点故障次数,分析、总结故障原因,进一步完善该方案。
现以屏蔽其它用户对偏移作业运行节点的访问,使作业在运行期间不受其它干扰,提高并行系
统效能方面,来详细阐述一下实现过程:
三 屏蔽其它用户对偏移作业运行节点访问的实现过程
首先选择参与并行运算的一百个节点形成hostsl00cheny文件,再将系统允许正常访问各节点
计算的大作业(一到二个月内)不受任何干扰;最后当偏移作业运行结束时再释放这些节点交给其
他用户使用,提高并行机群系统性能的整体发挥。
实现方法:
1.hostsl00cheny文件
该文件定义了参与并行计算的100个节点主机名
COOl
GlOO
2.usernames文件
该文件定义了系统允许正常访问机群节点的用户名
lill
liw
wuql
chenzd
fanxc
him
heyq
weidl
liyl
cheny
livf
3.denydo文件
该文件确保系统的可靠性,避免进行一些不正当的非法操作,给系统带来隐患。
文档评论(0)