利用判别分析筛选信用欺诈.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用判别分析筛选信用欺诈

利用判别分析筛选信用欺诈 一、问题描述 店铺评分是会员在成功后,仅限使用买家身份的淘宝网会员(下称“买家”)对本次交易的使用卖家身份的淘宝网会员(下称“卖家”)进行如下四项评分:宝贝与描述相符、卖家服务态度、卖家发货速度、物流公司服务。买家在淘宝网个人交易平台交易成功后,买家可以对本次交易成功的卖家进行如下四项评分:宝贝与描述相符、卖家服务态度、卖家发货速度、物流公司服务。买家在淘宝商城交易成功后,可对本次交易成功的卖家服务态度、卖家发货速度、物流公司服务三项指标分别作出评分,以及可对本次成功交易的每种商品作出宝贝与描述相符的评分;如果交易过程中发生部分商品退款,且交易买方选择 “未收到货”或“要退货”,则在退款完成后,此商品不参予宝贝与描述相符的评分,不发生评分则无分值;有效评分期内买家每完成一种商品的宝贝与描述相符的评分,则系统自动给买家默认一个好评,反之则系统不给买家默认评价根据淘宝的评分体系将各类店铺的信誉分为四个类型:红心、蓝钻、皇冠和至尊(见下图),从四种类型中各自选取十家店铺(数据见附录) 表一 淘宝评分表 4分~250分 红心 251分~10000分 蓝钻 10001分~500000分 皇冠 500001以上 至尊 二、统计量定义 y1=淘宝信用评分 y2=信用类别(红心、蓝钻、皇冠和至尊) x1=店铺宝贝数 x2=近30天平均退款速度 x3=近30天因商品质量问题退款数 x4=近30天因未收到货退款数 x5=近30天因买家无理由退款数 x6=近30天好评数 x7=近30天中评数 x8=近30天差评数 三、逐步回归 (一)基本思想 逐步回归的基本思想是:对全部因子按其对影响程度大小(偏回归平方的大小),从大到小地依次逐个地引入回归方程,并随时对回归方程当时所含的全部变量进行检验,看其是否仍然显著,如不显著就将其剔除,知道回归方程中所含的所有变量对的作用都显著是,才考虑引入新的变量。再在剩下的未选因子中,选出对作用最大者,检验其显著性,显著着,引入方程,不显著,则不引入。直到最后再没有显著因子可以引入,也没有不显著的变量需要剔除为止。 从方法上讲,逐步回归分析并没有采用什么新的理论,其原理还只是多元线性回归的内容,只是在具体计算方面利用一些技巧。 逐步回归分析时在考虑的全部自变量中按其对的贡献程度大小,由大到小地逐个引入回归方程,而对那些对作用不显著的变量可能是中不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行检验后失去重要性时,需要从回归方程中剔除出去。 Step 1 :计算变量均值和差平方和记各自的标准化变量为 Step 2 :计算的相关系数矩阵。 Step 3 :设已经选上了个变量:且互不相同,经过变换后为对逐一计算标准化变量的偏回归平方和,记,作检验,,对给定的显著性水平,拒绝域为。 Step 4 :Step 3 循环,直至最终选上了个变量,且互不相同。 (二)数据处理 以淘宝信用评分作为因变量,店铺宝贝数,好评数等作为自变量,代入spss进行逐步回归分析,选出t个最相关的变量,得到结果如下: 进入或剔除变量a 步 进入 剔除 方法 1 x6 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). 2 x5 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). 3 x3 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). 4 x8 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). 5 x7 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). 6 x4 . Stepwise (Criteria: Probability-of-F-to-enter = .050, Probability-of-F-to-remove = .100). a. Dependent Variable: y1 上图表示逐步回归每一步进入或剔除回归模型中的变量情况 模型统计量g Model R

文档评论(0)

xy88118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档