基于Logistic回归模型的车险续保率研究.docxVIP

基于Logistic回归模型的车险续保率研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 - 基于Logistic回归模型的车险续保率研究 基于Logistic回来模型的车险续保率讨论 3044〔2021〕13-0286-02 1讨论背景 随着社会经济的不断进展,RM的生活水平也在逐步提高,伴随着而来的是汽车数量在逐年攀升,与此同时,人们还想给自己的生命安全买个“保险〞,于是便带动了汽车保险行业的进展,其进展形势正在吸引越来越多的关注。对于汽车保险行业来说,如何吸引更多的车主前来投保并且留住老客户已经成了车险行业的一大难题。信息时代的到来,为车险企业提供了一个更加有力的武器,可以通过数字化技术来更加精准地了解客户,提前预报客户的续保率,并制定相应的营销和服务方案。 2问题分析 关于车险续保率的问题,需要建立数学模型进行求解。通过对数据的分析,可知影响客户续保的决策因素有许多,比方新车购置价,车龄,NCD等都会影响客户的确定。首先要对客户进行精准画像,将全部可能的影响因素进行归类,然后将这些因素作为是否续保的一个推断根据。但是,经过观看数据之后,我们发觉,影响因素过多,因此,我们选择接受层次聚类法进行精准画像,对不同层次的数据集进行划分。然后对各个影响因素进行量化处理,使冗杂的数据简洁化。再通过建立Lo-gistic模型,进行回来分析,得到每个影响因素的权重,把权重带入回来方程就可以得出續保率的函数方程。通过对续保率的求解,可以对客户是否续保进行预报。 3续保率 为了方便模型的求解,需要先将收集到的数据全部进行量化处理,如渠道,续保年,使用性质等,运用SPSS对数据进行量化处理。接着把量化后的数据值带入原始数据表,得到量化后的变量因素表,完成对原始数据的归一化处理。通过量化数据可以大大简化续保率的冗杂程度,使得模型求解更加简便。 数据量化后,就可以接受层次聚类法来分析,将联系紧密的变量归为一类,作为用户画像的一个衡量标准。先把n个样品看成n类,然后把性质最类似的两类归为一类,这样总量就变为n-1类,继续查找性质最类似的一类,再合并,直到把全部的变量都聚为一类,从而建立层次聚类模型。在层次聚类中,聚类统计量是指能反映样品或者变量之间性质的统计量。这里接受的聚类统计量为距离和相像系数。 1〕距离:主要用于对样品的聚类。常用的距离有马氏距离、肯定值距离和欧式距离,这里选取欧式距离来计算。对于任意两个样品a,b,欧氏距离公式为: 其中的βo是常数项,也称为截距。βi为回来方程所对应的的偏回来系数。 2〕优势比 指事件发生的概率〔Pi〕与事件不发生的概率〔1-Pi〕的比值,又称为OR值。其中OR值和EXP值是作为衡量权重大小的重要因素。 3〕sig值 又称作P值,作为衡量自变量与应变量是否具有显著相关性的因素。所得因素,只要sig值小于或等于0.05,即可被认为有显著影响。反之,则不被考虑到影响因素中。 4〕标准回来系数 因为不同的变量其衡量单位可能不同,所以不能直接接受偏回来系数的肯定值来比较权重的大小,而要使用标准回来系数。但构建回来模型的时候还得通过偏回来系数βi计算出标准回来系数。 如表1所示,将部重量化后的数据导入SPSS中。依据自变量所对应的Logistic回来方程,选用SPSS软件中的二元Logistic回来方式,得到推断模型正确率的分类表和推断显著性因素与求解回来方程系数的变量表。 从表1中的分类表可以看出回来模型的正确率为99.6%。依据EXP值,可以得到上述九个影响因素的权重。权重从大到小的顺序是:续保年险种签单保费NCD车辆种类渠道使用性质三者保险额车龄。依据图中的B值可以得到具体的置的值。从而最终得到N分布Logistic回来方程: 由公式f5〕可知,每个用户的续保概率都可以通过此二项分布Logistic回来方程计算出。 4结束语 本文针对如何推断车主的续保概率,运用层次聚类法对量化后的数据进行分类,利用SPSS近似得到用户的精准画像。通过二项分类Logistic回来模型,进行回来分析,得到续保率的回来方程,从而实现对续保率的预报。

文档评论(0)

153****5461 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体邢台正信工程技术咨询有限公司
IP属地河北
统一社会信用代码/组织机构代码
91130503MA7AX89M80

1亿VIP精品文档

相关文档