网站大量收购独家精品文档,联系QQ:2885784924

SPSSAU_机器学习_gbdt SPSSAU手册.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

SPSSAU-在线SPSS分析软件

GBDT模型SPSSAU

GBDT模型

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析4

6剖析6

GBDT(GradientBoostingDecisionTree)是一种基于决策树的集成学习算法,它将多个弱分类器(决策

树)进行迭代加权,来提升模型的准确性。在每一次迭代中,GBDT会根据上一轮模型的预测结果计算出

残差(实际值与预测值之差),并将残差作为下一轮模型的训练目标。其算法步骤如下:

第一:初始化,通过拟合一个初始模型(比如平均值),得到初始预测值;

第二:计算残差,计算当前模型的预测值与实际值之间的残差(差异);

第三:拟合残差,拟合一个回归树(决策树)来预测残差,使得残差减少;

第四:更新模型,通过将回归树的预测结果乘以一个学习率(或步长),更新当前模型;

第五:重复迭代,重复步骤2到4,直到达到预设的迭代次数或残差已经足够小;

第六:集成模型,将所有的回归树组合起来形成最终的集成模型,每棵树的预测结果加权相加,得

到最终的预测值。

SPSSAU-在线SPSS分析软件

GBDT模型案例

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析4

6剖析6

1背景

当前有一项关于‘信用卡交易欺诈’的数据科学研究,已整理好数据共为1000条,其包括六项,分

别是换设备次数,支付失败次数,换IP次数,换IP国家次数,交易金额和欺诈标签,欺诈标签时,数字

1表示欺诈,数字0表示没有欺诈行为,现希望通过GBDT进行模型构建,并且做一些预测工作,部分数

据如下图所示:

2理论

在进行GBDT模型时,其涉及参数如下表所述:

参数说明参数值设置

损失函数构建模型的算法方式,通常使用对于分类任务:deviance(默认,对数损失函数)

默认参数值即可exponential(指数损失函数,只适用于二分类)。

对于回归任务:ls(默认,平方误差损失)、lad(绝

对误差损失)、huber(结合平方误差和绝对误差)和

quantile(最小化预测值和实际值之间的分位数差异)

学习器数量用于构建的树的数量默认是100

树最大深度树的深度越大,则对数据的拟合默认是3

程度越高(过拟合程度也越高)

节点分裂最小样本限定一个节点必须包含至少多少其范围介于(0.0,1.0],默认1.0

数个训练样本,否则就不允许分枝

叶节点最小样本数限定一个叶子节点中包含的最小默认是2

样本数目

SPSSAU-在线SPSS分析软件

模型收敛参数当模型误差变化率小于该值时结默认是1

束模型构建

学习率学习率即模型参数更新步长,越范围(0.0,1.0]默认0.1

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档