在线集成学习-赵惟肖-2019-06-30-19_00_00.pdfVIP

下载本文档

0
0
约1.07万字
约 30页
2025-04-17 发布于山东
举报
版权申诉

在线集成学习-赵惟肖-2019-06-30-19_00_00.pdf

1、本文档共30页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

ThenameoftheDepartmentBeijingForestStudio

北京理工大学信息系统及安全对抗实验中心部门名称

在线集成学习

赵惟肖硕士研究生

2019年06月30日

内容提要

•背景简介

•基本概念

•算法原理

•优劣分析

•应用总结

•参考文献

在线集成学习

背景简介

•预期收获

–1.了解集成学习和在线学习基本思想

–2.回顾离线bagging（装袋）和离线boosting（提升）

的基本原理

–3.理解在线bagging和在线boosting的算法原理

背景简介

•集成学习

–对训练集数据，训练若干个弱学习器，通过一定的结合策略，

最终形成一个强学习器，以“博采众长”。

–Bagging系列算法：随机森林

–Boosting系列算法：AdaBoost、GBDT

弱学习器

强学习器

…结合策略

弱学习器

背景简介

•在线学习

–批量学习（Batch）：在训练模型时，一次性的把所有样

本全部输入，有存储要求，“填鸭式”。

–在线学习（Online）：每输入一个样本，计算一次误差并

调整参数，适用于实时产生数据的web网站，“水流式”。

–在工业界，参与训练的数据量很容易过TB，对资源的压力

很大。Batch-Online能带来明显的经济效益。

背景简介

•在线学习

基于决策树：ID5R、ITI

基于SVM：I-SVM

基于优化算法：OGD、FOBOS、FTRL

在线学习基于神经网络：ENN

基于无监督：SOINN

基于集成：Online-Bagging、Online-Boosting

在线集成学习

基本概念

•基本概念——随机森林（Bagging）

–用随机的方式建立一个“森林”，“森林”包括很多决策树，

对决策树的结果进行投票。（并型结构）

抽样

子训练集

抽样

子训练集

训

练

您可能关注的文档

文档评论（0）

说明书手册库 + 关注: 实名认证

文档贡献者

教师资格证持证人

24小时提供说明书查找服务。

咨询Ta 进入空间

领域认证该用户于2023年12月02日上传了教师资格证

1亿VIP精品文档

更多 >

在线集成学习-赵惟肖-2019-06-30-19_00_00.pdfVIP