Lecture 3_Decision Tree and Entropy_1 机器学习概论教学课件.ppt

下载文档 降价啦

2
0
约1.21万字
约 40页
2018-01-28 发布于浙江
举报
版权申诉
保障服务

Lecture 3_Decision Tree and Entropy_1 机器学习概论教学课件.ppt

1、本文档共40页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Lecture 3_Decision Tree and Entropy_1 机器学习概论教学课件

Lecture 3:Decision Tree and Entropy-1 邓志鸿北京大学信息科学技术学院回顾－Find-S 利用?g关系进行搜索 hj ?g hi ：（? x ? X）hi(x) =1 ? hj(x) =1 。从最特化的概念开始，每当遇到不能覆盖的正样本，就泛化该概念，使其能够覆盖上述正样本。特殊?一般算法描述 1. 初始化h为概念空间H中最特化的概念即在各个属性上都不能取值 2.对训练样本中的正样本x 对h在每个属性上的约束ai 如果x在该属性上满足ai ，则do nothing 否则用bi替换ai ， x在该属性上满足bi且bi是所有x满足的约束中是最小的输出h 回顾－版本空间 The general boundary（泛化边界）给定概念空间H和训练样本集D，泛化边界G定义如下： G ?{g?H | consistent(g, D) ? (??g’ ?H ) [g’ ?g g ? consistent(g’ , D) ]} The specific boundary（特化边界）给定概念空间H和训练样本集D，泛化边界G定义如下： S ?{s?H | consistent(s, D) ? (??s’ ?H ) [s ?g s’ ? consistent(s’ , D) ]} VSH,D ? {h ? H | (? s?S ? g?G )[g ?g h ?g s]} 回顾－Candidate-Elimination learning Algorithm 回顾－练习用上述两种方法学习下表中包含的概念（知识） Decision Tree（决策树）决策树方法是机器学习中最常用的归纳推理方法。决策树方法通过分析训练样本归纳出概念和知识。是逼近离散目标函数的方法，学习得到的函数以决策树的形式表示。内容决策树表示决策树算法熵，信息收益其它属性选取方法分类问题和归纳偏好过学习（Overfitting）决策树表示每个内结点（非叶结点）代表一个属性由结点出发的每条边对应一个属性值叶结点表示分类 DNF（析取范式） disjunctive normal form 决策树表示： A∧B∨?A∧C 决策树学习很多不同的树可以表示同一个概念但这些树大小各异 A∧B∨?A∧C Hyafil Rivest 于1976证明了学习最简单（最小）的决策树是一个NP-完全问题求助于启发式贪心法不能保证最优，但是很可能接近最优具体思想：首先构造一个空树选择一个“最好”属性，对训练样本进行分割递归上一过程决策树算法－ID 3 自顶向下的决策树归纳方法属性选择最好的属性? 产生最小规模的树启发：尽可能选择可生成“最纯节点”的属性常用“不纯”（不确定性）度量标准熵（Entropy）信息收益（information gain）基于熵随着由属性生成的子集的平均“纯度”的增加而增加。策略：选择导致信息收益最大的属性 Examples－有关不确定性不确定性度量随机试验S只有有限个不相容的结果A1, A2, …, An，它们对应的概率为P1, P2, …, Pn，满足用来度量S的不确定性的度量H(S)应该满足： 1. 是Pi的连续函数概率的微小变化不会引起不确定性发生很大变化。同时，连续函数也便于数学上处理。 2. 对n个等概结果的试验，H是n的单调函数当试验的结果越多时，在等概率出现的情况下，其相应的不确定性也应该越大。 3. 一个试验分成相继的两个试验时，未分之前的H是己分之后的H的加权和。这个要求也比较合理 Entropy （熵）定理（Shannon）：唯一满足上述三个条件的函数H具有下列形式熵 Shannon－简介香农（1916－2001）家族背景 1916年诞生于美国密西根州的一个小镇，父亲是法官，母亲是中学校长，祖父是农场主兼发明家（对他影响最大）据称与大发明家爱迪生还是远亲教育背景 1936年密西根大学获得数学与电气工程学士学位 1938年在MIT获得电气工程硕士学位硕士论文：《A Symbolic Analysis of Relay and Switching Circuits》(继电器与开关电路的符号分析) 用布尔代数分析并优化开关电路，这就奠定了数字电路的理论基础哈佛大学的Howard Gardner教授评价说“这可能是本世纪最重要、最著名的一篇硕士论文。” 1940年香农在MIT获得数学博士学位博士论文：《An Algebra for Theoretical Genetics》(理论遗传学的代数学) 很奇怪，研究关于人类遗传学。牛人就是这样，兴趣十分广泛。在不同的学科方面发表过许多有影响的文章。 Shanno

您可能关注的文档

文档评论（0）

qiwqpu54 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

Lecture 3_Decision Tree and Entropy_1 机器学习概论教学课件.ppt