- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ApacheCN 你装逼的选择;集成方法;AdaBoost(adaptive boosting: 自适应boosting)
* 能否使用弱分类器和多个实例来构建一个强分类器? 这是一个非常有趣的理论问题。
* 优点:泛化错误率低,易编码,可以应用在大部分分类器上,无参数调节。
* 缺点:对离群点敏感。
* 适用数据类型:数值型和标称型数据。
AdaBoost的一般流程
* 训练算法: 基于错误,提升分类器作为弱分类器,简单分类器效果更好
* 基于单层决策树构建弱分类器
* 单层决策树(decision stump, 也称决策树桩)是一种简单的决策树。
* 过拟合(overfitting, 也称为过学习)
* 发现测试错误率在达到一个最小值之后有开始上升,这种现象称为过拟合。;AdaBoost算法示意图;发现:
alpha目的主要是计算每一个分类器实例的权重(组合就是分类结果)
分类的权重值:最大的值,为alpha的加和,最小值为-最大值
D的目的是为了计算错误概率: weightedError = D.T*errArr,求最佳分类器
特征的权重值:如果一个值误判的几率越小,那么D的特征权重越少;非均衡分类问题;非均衡分类问题_ROC评估方法;非均衡分类问题_代价函数;非均衡分类问题_抽样
原创力文档


文档评论(0)