归纳与分析学习结合.pptVIP

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2003.12.18 机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 机器学习 第12章 归纳和分析学习的结合 概述 纯粹的归纳学习方法通过在训练样例中寻找经验化的规律来形成一般假设 纯粹的分析方法使用先验知识演绎推导一般假设 本章考虑将归纳和分析的机制结合起来的方法,并获得两者的优点:有先验知识时获得更高的泛化精度和依赖训练数据克服先验知识的不足 所得到的结合的方法比纯粹的归纳方法和分析方法的性能都要高 动机 归纳学习寻找拟合训练数据的一般假设,分析学习寻找拟合先验知识的一般假设,同时使它覆盖训练数据 归纳方法和分析方法对假设的论证方法有根本区别,因此优缺点互为补充,将它们结合起来有可能得到更强有力的学习方法 纯粹的分析学习方法的优缺点 优点:可用先验知识从较少的数据中更精确地泛化以引导学习 缺点:当先验知识不足或不正确时,可能产生误导 纯粹的归纳学习方法的优缺点 优点:不需要显示的先验知识,主要基于训练数据学习规律 缺点:训练数据不足时,会失败,会被其中隐式的归纳偏置所误导 表12-1 纯粹的分析学习和纯粹的归纳学习的比较 动机(2) 图12-1 概述了学习问题的分布范围,它随着可获得的先验知识和训练数据不同而变化 在一个极端,有大量的训练数据,但没有先验知识 在另一个极端,有很强的先验知识,但训练数据很少 多数实际学习问题位于这两个极端之间,通常可以从近似的先验知识开始 本章考虑的问题是: 什么样的算法,使用近似的先验知识结合可用数据来形成一般的假设 动机(3) 即使使用最纯粹的归纳学习算法,仍有机会基于特定学习任务的先验知识来选择设计方案 通常设计者将领域特定的知识嵌入到学习算法中,但我们感兴趣的是一个系统能将先验知识和训练数据作为显示的输入给学习器 概括而言,我们感兴趣的是领域无关算法,这种算法使用显示输入的领域相关的知识,这种算法具备以下的属性: 如果没有领域理论,它至少能像纯粹的归纳方法一样有效学习 如果没有完美的领域理论,它至少能像纯粹的分析方法一样有效学习 如果领域理论和训练数据都不完美,它应能结合两者的长处,比单纯的归纳或分析方法的性能要好 它应能处理训练数据中未知程度的差错 它应能处理领域理论中未知程度的差错 这里列出的期望目标很难达到,目前没有算法能以一般化的方式满足所有这些约束 学习的归纳-分析途径 本章考虑的学习问题 已知 一个训练样例集合D,可能包含差错 一个领域理论B,可能包含差错 候选假设的空间H 求解 一个最好地拟合训练样例和领域理论的假设 最好地拟合训练样例和领域理论的确切定义 学习的归纳-分析途径(2) 确定先验知识和数据权值的一种解决方法是使用贝叶斯观点 贝叶斯定律描述了怎样计算给定训练数据D时假设h的后验概率 贝叶斯定律基于观察到的数据D以及先验知识计算后验概率,以P(h), P(D)和P(D|h)的形式表示 我们可以把P(h), P(D)和P(D|h)看作是某种形式的背景知识 贝叶斯理论可看作一种为领域理论加权的方法,它与观察到的数据D一起,赋予h的后验概率为P(h|D) 贝叶斯公式提供了为先验知识和观察到数据的贡献加权的方法 但是,贝叶斯公式隐含假定了关于P(h), P(D), P(D|h)概率分布的完美知识 贝叶斯公式没有提供将这些近似已知的概率分布与观察数据结合起来的方法 假设空间搜索 大多数学习任务可以刻画为假设空间上的搜索任务,而决定这个搜索任务的4个参数是: 假设空间H 搜索的初始假设h0 定义单个搜索步的搜索算子集合O 指定搜索目标的判据G 本章探索了3种方法,它们用先验知识来改变纯归纳方法执行的搜索 使用先验知识推导出搜索起步的初始假设:Kbann 使用先验知识来改变假设空间搜索的目标:Ebnn 使用先验知识改变可用的搜索步:Focl 使用先验知识得到的初始假设 KBANN技术:一种使用先验知识的方法是将假设初始化为完美拟合领域理论,然后按照需要归纳地精化初始假设以拟合训练数据 这种技术的动机是:如果领域理论是正确的,初始假设将正确分类所有训练样例,而无需再修正;如果初始假设不能完美地分类训练样例,那么它需要被归纳精华,以改进它在训练样例上的拟合度 在纯粹归纳的反向传播算法中,权值一般被初始化为小的随机值,KBANN的含义是:即使领域理论是近似正确的,将网络初始化为拟合领域理论,比初始化为随机值有更好的近似开端 KBANN算法 KBANN假定领域理论用一组命题形式的非递归的Horn子句来表示,输入和输出如下: 已知: 一组训练样例 由非递归命题型Horn子句组成的领域理论 求解: 一个拟合训练样例的被领域理论偏置的人工神经网络 KBANN算法包含两个阶段 创建一个完美拟合领域理论的人工神经网络 使用反向传播算法来精化初始网络以

您可能关注的文档

文档评论(0)

文档分享 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档