大数据分析在油田安全形势研判应用.docVIP

大数据分析在油田安全形势研判应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据分析在油田安全形势研判应用

大数据分析在油田安全形势研判应用   [摘 要]近年来,各大油田陆续开展智能油田建设工作,油气生产物联网等自动化数据采集工作也在紧锣密鼓地开展,如何发现数据隐藏的价值、提高数据利用率、真正做到用数据找油,指导油田生产、实现降本增效成为目前油田亟待解决的问题。研究并利用大数据分析技术挖掘油田数据价值,实现开源节流创新创效,是当前国际油田发展的趋势,也是国内油田的需要。   [关键词]智能油田;大数据分析;数据挖掘   中图分类号:S917 文献标识码:A 文章编号:1009-914X(2018)16-0389-01   数字油田,油田中心数据库包括勘探、开发、储运、生产辅助、经营管理等业务领域的各类数据,涉及油田开发的数据包括单井、区块的日月报数据、分析化验数据、试井与生产测井数据、井下作业数据、井史数据以及地理信息数据等,种类丰富齐全,质量达到标准要求,为生产数据分析应用提供了数据资源基础。通过近几年的研究与实践发现,智能油田的全面感知、分析预测、优化决策等均与大数据分析有关,根据油田大数据分析发现油水井生产规律,可以更好地指导油田生产及优化决策。   1.油田大数据的概念及处理流程   大?稻菔紫染哂兴母鲋饕?特点:数据量大(Volume)、产生速度快(Velocity)、数据类型多(Variety),数据的真实性(Veracity),合称4V或4Vs。大数据由巨型数据集组成,其数据量超出人们采用常规方法在可接受时间内收集、使用、管理和处理数据的能力,但最终体现为价值,实现数据→信息→知识→智慧的转变。在油田生产中大数据分析的概念可理解为:在油田生产、管理中产生的具有连续变化、能够反映油田客观规律的各类数据,以及对这些数据的分析处理。   大数据的处理主要包括7个步骤,分别是:数据采集和提取集成、数据清洗、数据分析从而发现有价值的规律、建立分析预测模型、结果展示可视化和知识表达、结果验证,以及对模型的效果评估优化。   2.大数据分析平台及体系架构研究   结合目前油田生产数据建设情况,以及油田生产应用需求,构建油田大数据分析平台及体系架构,主要包括数据抽取、分布式存储、大数据分析及展示应用4层架构。   数据抽取层主要是实现分布在各数据库或系统中的数据整合,并转换成适合数据挖掘或建模的形式,构建样本数据集;存储层主要是实现汇总数据、模型数据、分析数据以及元数据等各类数据的存储,相当于数据仓库;分析层是基于大数据建模算法和工具,挖掘数据中隐藏的模式或关系,采用数据建模软件建立分类或预测模型,从而生成预测结果,确定评估方法并利用测试样本,结合专家经验不断提升模型精度,辅助油田生产决策;数据应用层将建立的数据模型封装成可运行软件,包括建模算法的实现、数据的可视化和界面设计等,最终展示给用户使用,实现人机交互。   3.大数据分析技术研究   通过上述研究分析总结出大数据分析需要的两大技术:一是大数据抽取及预处理技术,二是大数据分析技术。   3.1 大数据抽取及预处理技术   数据抽取就是将多种结构和类型的数据抽取转化为单一的或便于处理的结构类型。不同时间、不同地点、不同名称的相同数据所表达的内涵和算法要求一致,是标准化、规范化的自然语言集合,便于计算机理解,是数据提取的关键。   数据清洗主要用于确定有用记录和字段,检查数据是否存在缺失、数值异常等情况,解决办法可用剔除法或使用估计值、平均值填补,错误数据可利用逻辑关系手动替换。数据构建是为了满足大数据建模需求而创建的新字段,以作为特征参数,如平均值。数据变换是把原始数据转换成为适合数据挖掘的形式,如归一化处理等。   3.2 大数据分析技术   大数据分析主要包括聚类分析、因子分析、相关分析、回归分析、A/B测试以及数据发掘等,上述方法在油田常用的有聚类分析、因子分析、回归分析和数据发掘。   聚类分析是把具有某种相似特征的物体或者事物归为一类,目的在于辨别在某些特性上相似的事物,并按这些特性将样本划分成若干类,使在同一类内的事物具有高度同质性,而不同类的事物则有高度异质性。   因子分析是用少数几个因子去描述多个指标或因素间的联系,即将相互比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原数据的大部分信息。   回归分析是在一组数据的基础上,研究一个变量与其他变量之间的相关关系,寻找被随机性掩盖的变量之间的依存关系。通过回归分析,可以把变量间复杂的、不确定的关系变得简单化、有规律化。   数据挖掘是大数据时代的关键技术,是指从非完整的、海量的、有噪音的、模糊且随机的数据中挖掘隐含在内且人们未提前得知的有用信息的过程。一般来说,数据挖掘的功能有两类:描述和预测。描述性挖掘用于展现集体数据的一般特性,而预

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档