- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SPSSAU-在线SPSS分析软件
Extratrees极端随机树模型SPSSAU
极端随机树
Contents
1背景2
2理论2
3操作3
4SPSSAU输出结果3
5文字分析4
6剖析6
ExtraTrees(ExtremelyRandomizedTrees)算法是一种集成学习方法,通过构建多棵极度随机化的决
策树来提高模型的泛化能力和稳定性。主要步骤如下:
第一:样本选择,从训练数据中随机选择样本;
第二:特征选择,在每个节点,随机选择一部分特征;
第三:分裂点选择,对每个选定的特征,随机选择一个分裂点;
第四:节点分裂,使用随机选择的特征和分裂点来分裂节点,创建子节点;
第五:树构建,重复上述步骤,直到达到预定的停止条件(如最大树深或最小节点样本数);
第六:集成结果,对所有树的预测结果进行集成(分类问题使用投票,回归问题取平均值)。
这种随机性使得ExtraTrees算法在处理高维数据和防止过拟合方面具有优势。
SPSSAU-在线SPSS分析软件
极端随机树模型案例
Contents
1背景2
2理论2
3操作3
4SPSSAU输出结果3
5文字分析4
6剖析6
1背景
当前有一项关于‘信用卡交易欺诈’的数据科学研究,已整理好数据共为1000条,其包括六项,分
别是换设备次数,支付失败次数,换IP次数,换IP国家次数,交易金额和欺诈标签,欺诈标签时,数字
1表示欺诈,数字0表示没有欺诈行为,现希望通过极端随机树进行模型构建,并且做一些预测工作,部
分数据如下图所示:
2理论
在进行极端随机树模型时,其涉及参数如下表所述:
参数说明参数值设置
节点分裂标准用于在构建决策树时产生分枝的分类任务时:gini:衡量节点的不纯度,gini值越
依赖标准小,节点越纯,默认分裂标准项。entrop:基于信息
增益,Entropy越小,节点越纯。
回归任务时:squared_error:均方误差(MSE),即目
标值与预测值之间的平方误差的均值。
absolute_error:绝对误差(MAE),即目标值与预测值
之间的绝对误差的均值。poisson:泊松误差,基于
泊松分布的误差标准,适用于计数数据的回归问
题。
最大特征数目限制极端随机树在构建每棵决策树auto:系统自动判断(默认值);sqrt:特征总数的开
时,能使用的最大特征数目平方;log2:特征总数取2为底的对数。
节点分裂最小样本限定一个节点必须包含至少多少默认是2
SPSSAU-在线SPSS分析软件
数
您可能关注的文档
最近下载
- 中医刮痧操作大全演示文稿.ppt VIP
- 供应链牛鞭效应.pptx
- 最全普通心理学课件2.ppt VIP
- 小红书搜索推广营销师认证考试题(附答案).doc VIP
- 牛津版八年级的英语下册unit1综合测试题.doc.docx
- 初中中考英语经典易错题.docx
- 半导体洁净室 水溶性空气分子污染物(AMC)的测定 离子色谱法及编制说明.pdf
- 汽车吊组装、拆除专项方案.pdf
- 基于STM32的智能小车.docx
- AP环境科学 2020年题库第二套题目 (选择题+问答题) AP Environmental Science 2020 Released Exam and Answers Bank 2.pdf VIP
文档评论(0)