- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树随机森林adaboost
决策树、随机森林、adaboost
七月算法 龙老师
2016 年5月28 日
主要内容
复习信息熵
熵、互信息
决策树学习算法
信息增益
ID3 、C4.5 、CART
Bagging 与随机森林
提升
Adaboost/GDBT
4 月机器学习算法班
2/51
熵与互信息
熵是对平均不确定性的度量
平均互信息:得知特征Y 的信息而使得对标
签X 的信息的不确定性减少的程度。
4 月机器学习算法班
3/51
熵与互信息
4 月机器学习算法班
4/51
各个熵之间的关系
4 月机器学习算法班
5/51
决策树
根节点
父节点
子节点
叶子节点
分叉
属性
标签
4 月机器学习算法班
6/51
决策树(Decision Tree)
决策树学习采用的是自顶向下的递归方
法,
其基本思想是以信息熵为度量构造一棵
熵值下降最快的树,到叶子节点处的熵
值为零,
此时每个叶节点中的实例都属于同一类
。
有监督学习
4 月机器学习算法班
7/51
决策树学习的生成算法
建立决策树的关键,即在当前状态下选择哪
个属性作为分类依据。根据不同的目标函数
,建立决策树主要有一下三种算法。
ID3
C4.5
CART
4 月机器学习算法班
8/51
信息增益
特征A对训练数据集D 的信息增益g(D,A) ,
定义为集合D 的经验熵H(D) 与特征A给定条
件下D 的经验条件熵H(D|A) 之差,即:
g(D,A)=H(D) – H(D|A)
显然,这即为训练数据集D 和特征A 的互信息。
遍历所有特征,选择信息增益最大的特征作
为当前的分裂特征
4 月机器学习算法班
9/51
其他目标
信息增益率:gr(D,A) = g(D,A) / H(A)
C4.5
Gini 系数:
CART
4 月机器学习算法班
1
您可能关注的文档
- 2015年河南畜牧兽医行政执法人员考试试卷-邓州畜牧兽医执法网.DOC
- 2015年大学生创新性试验项目报国家级级项目.DOC
- 2015年级科技基础条件专项资金项目验收报告.DOC
- 2015年南平科技成果登记公示第二批-南平科学技术局.DOC
- 2016年全国各地中考化学试题分类解析汇编第一辑自然界的水.DOC
- 2016年山东威海中考真题语文.PDF
- 2016年陕西科技统筹创新工程计划项目申报指引-西安石油大学.DOC
- 2015年基于教师科研的SRTP项目.DOC
- 2016秋-舌尖上的微生物霉菌篇.PDF
- 2017届化学第一轮复习-5132氯溴碘的制备.PPT
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
原创力文档


文档评论(0)