- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于机器学习算法的石油钻速研究
摘要:随着人工智能,大数据等新兴科技的普及,将传统行业与这些新技术结合已经成为重要课题,也对行业发展至关重要。石油钻井是典型的传统工业学科,钻速预测与优化一直是该行业内的研究重点,提升钻进速度可以有效地提高钻井效率、缩短钻井周期、降低钻井成本。系统设计了一个石油钻井的钻速预测系统,主要包括数据清洗,离群点处理,钻速预测三个模块,通过LightGBM,Rnn等算法实现钻速优化。
0 引言石油行业是一个涉及了多个学科的综合性工业领域,而在石油钻井领域中,减少成本,提高效率是所有人长期研究的课题。在如今信息化的时代,如何将传统的石油钻井项目与机器学习等创新型技术结合,建立数字化油田,是石油工作者目前工作的重点之一。本项目计划通过对钻井过程中的数据进行分析,使得机器学习、深度学习等创新型项目在钻井领域获得初步应用,对钻井速度进行优化。1 系统总体架构设计数据选择模块是对钻井过程中获得的参数进行筛选,该模块主要内容包括以下两点:第一是对比不同井的钻井数据,选择出数据量最大,参数最多,时间最长的一组钻井数据。第二是对钻井的参数进行对比,删除在整个钻井期间都维持不变的静态参数,并且把钻速为空的时间段删除。最终,数据选用2021年美国开源钻井数据,井号为16a_32,数据是2020年10月25日到11月4日每隔10秒收集一次的钻井数据,有32个参数,大约56万条数据。2 数据清洗模块设计数据清洗模块的目的为解决数据的质量问题。例如比如数据部分缺失、特征无效等。该模块主要工作为以下两点:第一,删除无关的数据,即剔除掉那些对于模型的实验结果无关的数据,例如钻头直径这样的数据;第二,删除特征值全为空或为0的数据。在钻井过程中,可能存在记录时出现错误导致没有记录的情况,这些参数就会为空,可以认为其是无效参数,可以在数据中删除。通过数据选择模块,可以保证实验时的钻井数据的数据质量,为接下来的实验做铺垫。3 离群点模块设计离群点指的是那些间隔较远、明显偏离其他数据点的样本点。其作用为检测并处理数据中存在的离群点。在数据分布上,普通样本平时聚集在一小块区域,而离群点的分布则比较稀疏,并且与其他样本点相距比较远。所以需要对离群点进行检测与删除的工作。于是得出结论,即该模块中主要进行三部分工作:(1)通过运用单元的3离群点算法与MAD离群点算法进行模型运算,通过rmse的得分进行对比,从单元离群点算法中选择出实验效果较好的算法。(2)通过运用多元离群点检测算法,例如:Isoliation Forest、Local outlier Factory、Elliptyc envelop等算法进行比较与选取,选出多元离群点检测算法中实验效果较好的一个算法。(3)将多元离群点检测算法中实验效果较好的那一个与单元离群点检测算法中实验效果较好的那一个进行融合,变成既能照顾到单元离群点检测算法,又能照顾到多元离群点检测算法的数据,将其删除。这样一来,就可以得到更加适用与石油钻井领域的离群点去除算法。4 数据分割与归一化模块对数据进行归一化与标准化的原因是运用机器学习解决石油领域或其他领域的实际问题时,数据中有可能出现由于特征之间相互有不同的衡量标准,导致即使使用同一类型的度量,各个特征之间的差异性也会非常大。例如特征A与特征B都是关于路程的特征,特征A一般使用千米单位进行测量,而特征B一般运用米来进行度量。这种情况下,如果不引入数据的标准化的方法,则会使得特征A的影响要远远比特征B的影响要大。因此,为了对这种情况进行排除,需要将数据进行归一化或标准化。通过离群点去除算法将离群点去除后,需要进行数据集的归一化与标准化处理,以及对数据的清洗。首先,运用sklearn中的算法将数据集分割成media和valid两个数据集,testsize设置为0.2,然后将midia再次通过sklearn中的数据集分割算法,testsize再次设置为0.2,最后得到训练集,测试集以及验证集。5 钻速预测方案设计针对一般的优化问题,首先要对相关输入与输出的关系建立映射,为了达到最优化的目的,应基于这种映射来找到全局最优解。要想将这种方法应用到实际的项目中去,应该做到以下两点:第一是建立目标特征与其他特征建立对应关系,在本项目中对应的是将钻速与其他特征例如钻压,大勾高度等参数建立映射关系;第二则是在模型训练后寻找函数本身的最优点。在本项目中,重点与难点是进行数据的分析,即对于石油钻井的各项参数的可视化,图表分析。通过对石油钻井数据的分析,我们才能进一步得出结论。所以,该模块分为以下两个部分:(1)通过对数据的分析,合理的使用数据预处理的各个模型,使得模型拟合效果达到不错的效果,并在这个过程中,通过查看各个参数对ro
您可能关注的文档
- 基于互联网+大赛的大学生创新创业教育模式探索.docx
- 基于机器学习LSTM网络的SO.docx
- 基于技能大赛的工业分析技术专业实训教学改革——以榆林职业技术学院为例.docx
- 基于交叉学科实践的药学专业创新人才培养新模式——以药物化学生物学第二课堂实践为例.docx
- 基于教师日常行为视角的大学城孤岛化研究——以济南长清大学城为例.docx
- 基于卷积神经网络和迁移学习的电动泵故障诊断方法研究.docx
- 基于决策树的SM4分组密码工作模式识别.docx
- 基于科研平台六好理念研究生创新能力的培养实践.docx
- 基于劳动教育培养新时代邮政人才的研究与实践.docx
- 基于流程自动化的分布式光伏业务智能财务平台探讨——以国网Y分公司为例.docx
原创力文档


文档评论(0)