- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能机器学习 道路曲折前程广阔.doc
人工智能机器学习 道路曲折前程广阔?
1?
当前激动人心的人工智能浪潮,是由于机器学习技术的突破推动的。
实际上,人工智能机器学习有过比较曲折的发展历程。图1是截取自北京大学黄铁军教授一次演讲[1]的PPT。注意,图中的道路并非是笔直的,而是曲折的。伊恩?古德费洛等著的《深度学习》一书,也把深度学习的历史追溯到20世纪40-60年代“控制论”和20世纪80-90年代“连接主义和神经网络”的兴起,其间有过低潮和冷清,2006年以“深度学习”的名义复兴。
图1?人工智能潮起潮落(引用黄铁军)
这篇博文以石油物探领域为例,看人工智能机器学习的应用潮起潮落。
机器学习应用于石油物探,是采用监督和无监督学习方法,例如利用神经网络方法,在地质或地球物理数据中识别相似的模式。虽然有许多种不同类型的神经网络,但根据油气勘探问题的类型,可分为两类:其一,分类问题,其二,预测问题。在分类问题中,将输入样本分配给几个输出类中的一个,例如砂岩、页岩和石灰石。在预测问题中,我们给输出样本分配一个特定的值,比如一个孔隙度值。
神经网络也可以通过训练的方式分为两类(图2):其一,有监督学习方式,其二,无监督学习方式。在有监督学习中,神经网络从训练数据集开始,已经知道训练数据集的输入和输出值。神经网络算法“学习”该训练数据集的输入和输出之间的关系,然后将“学到”的关系应用到预先不知道输出值的数据集。
图2?机器学习
2?回顾
正如伊恩?古德费洛将深度学习的历史追溯到20世纪40-60“控制论”,石油物探计算机应用可以追溯到20世纪50年代初。当时MIT数学系的GAG(地球物理分析小组)研究将控制论的创始人罗伯特?维纳的时间序列分析理论应用于石油勘探地球物理数据分析。
后来在1980年代末,随着连接主义和神经网络的兴起,机器学习在石油物探领域的应用掀起过一阵热潮。那时主要利用神经网络进行地震数据初至波的拾取和道编辑等。在石油勘探地震数据处理中,初至波的拾取和道编辑很费人工。而神经网络是一种数学算法,可以训练解决通常需要人工干预的问题。
这个时期使用的神经网络,是多层感知器(MLP)。多层感知器也称为全连接神经网络,数据从输入层流向输出层,输入层和输出层之间有一个或多个隐层。其训练策略是把输出单元计算的误差作为网络误差,反向传回去,计算出其它层的误差,然后更新权重。可望将多层感知器用于地震解释中的模式识别和分类,那时尽管有过尝试,但并没有很成功的案例。
在油气勘探界,地质家华莱士·普赖特的名言——“最先发现石油的地方,是在人们的大脑里面”影响甚远。传统主义者一直怀疑人工智能系统能够替代人类的大脑。但现在越来越多的人相信:石油是人们的头脑从数据中找到的,人工智能提供了强大的数据解释过程,可以帮助地球科学家找油。地球科学家们已经具备找油的知识储备和经验。当资源变得越来越稀缺,人工智能机器学习系统可以对确定新井位起关键作用,并在使科学家和工程师能够更有效率工作方面发挥着关键作用。
接着经历了一段时间的低潮后,在21世纪初,神经网络在石油物探中的应用发展开始复苏。在过去的十五年中,神经网络在地球物理数据分析中的应用有两个特点:其一,几乎全与地震属性分析有关,包括利用地震属性预测储层性质的有监督神经网络,或预测相分布的无监督方法。图3是多层感知机被用于多属性分析一个示例。其二,使用的算法更多样,包括利用k-均值、k-近邻、自组织映射、生成拓扑映射、支持向量机、近似支持向量机、概率神经网络PNN,?广义回归神经网络GRNN和径向基函数网络RBFN等,成功地提取了多个地质体的地质特征。
图3?多层感知机神经网络
K均值聚类算法是无监督学习,而K近邻算法是监督学习。两者均为最简单的机器学习算法。K均值聚类算法是将给定数据集划分为k个簇的算法。首先,随机生成k个初始点作为质心,将数据集中的数据按照距离质心的远近分到各个簇中。然后,将各个簇中的数据求平均值,作为新的质心。如此重复,直到所有的簇不再改变。K近邻算法也称KNN。给定一个训练数据集,对新的输入实例,KNN在训练数据集中找到与该实例最邻近的K个实例(也就是所谓K个邻居),这K个实例的多数属于某个类,就把该输入实例分类到这个类中。
KNN被用于地震相分析。地震相分析是根据地震和测井资料了解地下构造、岩性变化和储层分布的重要信息的重要方法。该方法对于降低钻井风险和寻找经济圈闭具有重要意义,可用于石油勘探开发的不同阶段。为了应用KNN生成准确的地震相图,从测井曲线和地震资料中提取频率、振幅和相位等地震属性,对相似地震道进行分类。虽然也可以利用非监督方法(如K均值聚类算法)对相似地震道进行分类,建立地震相图,但利用KNN有监督分类方法,对储层和地震相分布的描述精度较高,效率也较高。图4是伊朗某油田碳酸盐岩储层利用KNN分类器地震相
文档评论(0)