SPSSAU_机器学习_Adaboost SPSSAU手册.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

SPSSAU-在线SPSS分析软件

Adaboost模型SPSSAU

Adaboost模型

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析3

6剖析6

AdaBoost(AdaptiveBoosting)算法的核心思想是将多个弱分类器组合成一个强分类器。其算法步骤

如下:

第一:初始化权重,为每个训练样本分配相等的初始权重;

第二:训练弱分类器,根据当前样本权重训练一个弱分类器,并计算其错误率;

第三:更新权重,增加错分类样本的权重,使后续弱分类器更关注这些样本,减少正确分类样本的

权重;

第四:组合分类器,将所有弱分类器的加权结果组合起来,形成最终的强分类器;

最后:通过反复迭代以上步骤,AdaBoost能够显著提高分类性能。

SPSSAU-在线SPSS分析软件

Adaboost模型案例

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析3

6剖析6

1背景

当前有一项关于‘信用卡交易欺诈’的数据科学研究,已整理好数据共为1000条,其包括六项,分

别是换设备次数,支付失败次数,换IP次数,换IP国家次数,交易金额和欺诈标签,欺诈标签时,数字

1表示欺诈,数字0表示没有欺诈行为,现希望通过Adaboost进行模型构建,并且做一些预测工作,部分

数据如下图所示:

2理论

在进行Adaboost模型时,其涉及参数如下表所述:

参数说明参数值设置

损失函数构建模型的算法方式,通常使用其仅针对回归任务时使用。linear:使用预测误差的

默认参数值即可绝对值来衡量误差的大小。square:使用预测误差的

平方来衡量误差的大小。exponential:使用预测误差

的指数值来衡量误差的大小。

学习器数量用于构建的树的数量默认是50

学习率学习率即模型参数更新步长,越范围(0.0,1.0]默认0.1

小收敛越快,但迭代次数越多。

任务类型包括自动判断,分类和回归任务系统会结合Y的不同数字个数自动判断分类或回归

任务,当然可自行选择分类或回归任务

除此之外,与其它的机器学习算法类似,SPSSAU提供训练集比例参数(默认是训练集占0.8,测试集

占0.2),数据归一化参数(默认不进行),以及保存预测值(Adaboost时会生成预测类别,但不会生成预

测概率),保存训练测试标识(生成一个标题来标识训练集和测试集数据的标识)。

SPSSAU-在线SPSS分析软件

3操作

本例子操作截图如下:

将欺诈标签放入Y框中,其余5个特征项作为自变量X。与此同时,训练集比例默认为0.8,暂不

进行数据归一化,当然当前数据也可考虑做标准化处理,因为涉及数据的量纲不同。更多参数设置暂保持

为默认值。

4SPSSAU输出结果

SPSSAU共输出5项结果,依次为基本信息汇总,特征权重

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档