机器学习理论浅述.docVIP

下载本文档

18
0
约2.66千字
约 7页
2018-11-16 发布于福建
举报
版权申诉

机器学习理论浅述.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习理论浅述

机器学习理论浅述　　摘要：本文介绍了人工智能学科中机器学习的概念、发展、分类及应用情况。　　关键词：机器学习人工智能基本模型　　1.引言　　“机器学习”是人工智能的重要研究领域之一。机器学习的定义是“系统通过积累经验而改善系统自身的性能”。通俗地说，就是让机器去学习，利用学到的知识来指导下一步的判断。最初研究机器学习，是让计算机具有学习的能力，以实现智能化。因为人们认为具有人工智能的系统首先必须具有学习能力。机器学习的研究始于神经元模型研究，此后又经历了符号概念获取、知识强化学习研究阶段，至今已发展到连接学习和混合型学习研究阶段。　　2.机器学习系统的基本模型　　根据机器学习的定义，建立如图1所示的机器学习基本模型。　　模型中包含学习系统的四个基本组成环节。　　环境和知识库是以某种知识表示形式表达的信息的集合，分别代表外界信息来源和系统具有的知识。学习环节和执行环节代表两个过程。学习环节处理环境提供的信息，以便改善知识库中的知识。执行环节是整个机器学习系统的核心。利用知识库中的知识来完成某种任务，并把执行中获得的信息送还给学习环节。　　2.1机器学习的分类　　很多学者从不同的角度对机器学习进行了分类，这里简单阐述一下继续学习策略的机器学习的种类。按照学习策略的不同，机器学习分为机械学习、归纳学习、基于解释的学习、基于神经网络的学习和基于遗传算法的学习。　　2.1.1机械学习　　机械学习（Rote Learning）就是“死记硬背式的学习”，靠记忆存储知识，需要时检索已经存下来的知识使用，不需要计算和推理。机械学习的模式如下：需要解决的问题为{y，y，...，yn}，输入已知信息{x，x，...x}后，解决了该问题，于是将记录对{{x，x，...，x}，{y，y，...，y}}存入数据库，以后当遇到问{y，y，...，y}时，检索数据库，即可得到问题{y，y，...，y}的解答是{x，x，...，x}。　　能实现机械式学习算法的系统只需具备两种基本技能：记忆与检索。此外，存储的合理安排，信息的合理结合，以及检索最优方向的控制也是系统应该考虑的问题。该算法简单、容易实现、计算快速，但是由于系统不具备归纳推理的功能，对每个不同的问题，即使是类似的问题，也需要知识库中有不同的记录。因此占用大量的存储空间，这是典型的以空间换时间的算法。　　2.1.2归纳学习　　归纳学习是应用归纳推理进行学习的一种方法。归纳学习的过程是由特殊实例推导出一般情况的过程，这样就使类似的问题可以利用同样的方法求解。归纳学习的过程就是示例空间与规则空间的相互利用与反馈。1974年，Simon和Lea提出了双空间模型，形象地对这一执行过程进行了描述，如图2所示。　　归纳学习算法简单，节省存储空间，在一段时间内得到了广泛的应用。在应用过程中，该算法逐渐显现出它的缺点：（1）归纳结论是通过对大量的实例分析得出的，这就要求结论的得出要有大量实例作支撑，而这在许多领域都是无法满足的。（2）归纳结论是由不完全训练集得出的，因而其正确性无法保证，只能使结论以一定概率成立。（3）该算法通过对实例的分析与对比得出结论，对于信息的重要性与相关关系无法辨别。　　2.1.3基于解释的学习　　基于解释的学习（Explanation-Based Learning）是运用已知相关领域的知识及训练实例，对某个目标概念进行学习，并通过后继的不断练习，得到目标概念的一般化描述。该学习的执行过程如图3所示。　　这种方式的学习得到一个领域完善的知识往往是比较困难的，这就对该算法提出了更高的要求。为解决知识不完善领域的问题，有以下两个研究方向[2]：（1）改进该算法使其在不完善的领域理论中依然有效。（2）扩充该领域的知识使其拥有更强的解释能力。通常情况下，第二种改进方法更重要些。　　2.1.4基于神经网络的学习　　神经网络是由许多类似神经元的节点和它们之间带权的连接组成的复杂网络结构，是为模仿人类大脑的复杂神经结构而建立起来的抽象数据模型，希望相似的拓扑结构可以使机器像人脑一样进行数据的分析、存储与使用。神经网络学习的过程就是不断修正连接权的过程。在网络的使用过程中，对于特定的输入模式，神经网络通过前向计算，产生一个输出模式，并得到节点代表的逻辑概念，通过对输出信号的比较与分析可以得到特定解。在整个过程中，神经元之间具有一定的冗余性，且允许输入模式偏离学习样本，因此神经网络的计算行为具有良好的并行分布、容错和抗噪能力。　　神经网络学习算法是一种仿真算法，拥有良好的认识模拟能力和有高度的并行分布式处理能力。但神经网络模型及其参数设置难以确定，需要长时间的试验摸索过程。并且，对于最后得到的神经网络，其反映的知识往往难以让人理解。为解决这些问题，构造神