- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SPSSAU-在线SPSS分析软件
Logistic回归ROC曲线SPSSAU
Logistic回归
Contents
1背景2
2理论2
3操作3
4SPSSAU输出结果3
5文字分析4
6剖析6
在机器学习应用中,Logistic回归可用进行数据分类和数据预测,在SPSSAU机器学习模块中,
Logistic回归的应用场景即为分类和预测,其与SPSSAU进阶方法中的二元logit回归或者多分类logit回归
一致,但应用场景有区别,进阶方法中的二元Logit回归或者多分类Logit回归主要用于研究影响关系,但
机器学习模块中的Logistic回归侧重于研究数据的分类和预测作用,因而即使原理一致,但输出的指标等
却完全不同。
SPSSAU-在线SPSS分析软件
Logistic回归案例
Contents
1背景2
2理论2
3操作3
4SPSSAU输出结果3
5文字分析4
6剖析6
1背景
当前有一项关于‘信用卡交易欺诈’的数据科学研究,已整理好数据共为1000条,其包括六项,分
别是换设备次数,支付失败次数,换IP次数,换IP国家次数,交易金额和欺诈标签,欺诈标签时,数字
1表示欺诈,数字0表示没有欺诈行为,现希望通过一些机器学习算法来构建模型,并且做一些预测工
作,部分数据如下图所示:
2理论
Logistic回归时,如果Y为二分类,那么其数学模型为Logit(P/(1-P)=常数+b1*x1+b2*x2+…,如果
是多分类时,其实质上是进行多次二分类,比如Y为3个类别,那么则进行2次(3-1=2)二元Logit回
归,这是其数学原理。与此同时,在进行Logistic回归时,其涉及参数如下表所述:
参数说明参数值设置
优化算法Logistic回归内部涉及的数学算lbfgs:默认lbfgs牛顿法,算法较稳定;
法,可结合数据样本量等进行选liblinear:小型数据时使用;
择使用newton-cg:另一种牛顿迭代法;
newton-cholesky:样本量远大于特征数量时可以
使用;
sag:样本量非常大时建议使用;
SPSSAU-在线SPSS分析软件
saga:大型数据时候使用它
正则化防止过拟合问题的处理技术方式L1(Lasso正则化):减少参数数量降低模型复
杂度,通常在特征选择应用时使用它;
L2(Ridge正则化):通常用于处理过拟合问题
文档评论(0)