基于粗糙集理论车险续保率因素分析.docVIP

基于粗糙集理论车险续保率因素分析.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集理论车险续保率因素分析

基于粗糙集理论车险续保率因素分析   中图分类号:F842 文献标识:A 文章编号:1009-4202(2011)08-000-02   摘 要 本文首先还原出原始表单,即每辆车的车龄、承保渠道、购买价格、品牌、出现次数、使用性质以及续保与否都能表示出;其次,采用粗糙集理论(RS)产生规则,用规则的可信度代表各个续保情况内的离散度较小的信息;最后以每个规则的可信度组成的行向量作为目标变量(即能代表续保),以规则内各个因素分别作为比较变量,进行灰色关联度分析,从而获得可信度与个因素的关系,即续保情况下与因素的关系,推广到续保率与因素的关系。   关键词 续保率因素分析 灰色关联度分析 粗糙集理论(RS)      一、背景   进入21世纪以来,伴随着居民收入的提高、汽车价格的下降以及消费环境的改善,中国的汽车市场规模不断扩大,需求量和保有量出现了加速增长的趋势。从2004年到2010年,???国的汽车保有量正以16%―20%的速度快速增长,截止到2010年,中国的汽车保有量达到了6650万―8431万辆,单年需求量也达到了1300―1900万辆,中国在未来成为世界上最具成长性和规模最大的消费市场已经指日可待。当汽车保险行业的竞争愈加激烈时,保险公司不仅需要开拓新的客户领地,也需要维持并提高一定的续保率。建立数学模型并进行相应的数据分析来说明影响续保率的相关因素。二、数据预处理   已知数据分别为“按照承包车辆出险次数统计”,“按照承保车辆年龄统计”,“按照承保车辆品牌统计”,“按照承保车辆使用性质统计”,“按照承保渠道统计”和“按照新车购买价统计”这六个因素。数据给出了每个因素中各项到期车辆数、以及续保的百分比,我们根据这些信息可以还原模拟出满足这几项按照不同统计对象所得数据的最初表单,将信息整合化、清晰化。我们采取类比抽样的方式,调查到期车辆数目取为1000,不致繁琐且能够基本代表现实情况。   记为:(a(1),a(2),…,a(1000))   其中a(i)为第i辆的各项精确属性组成的行向量,如图:   三、粗糙集理论(RS)   是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不一致、不精确、不完整等各种不完备信息,并从中发现隐含的知识以及潜在的规律。   建立在分类机制的基础上。依据粗糙集理论, 可以发现信息系统在不同简化层次上符合置信度要求的规则; 应用得到的规则进行推理或决策, 根据已有的信息在模型上逐层匹配, 再按照某种优先级判定算法, 给出现有信息下问题的最优解。   #8226; 系统客观层面的规则价值衡量方法:从系统客观层面评价一条规则主要依据可信度、覆盖率和支持率三个指标来衡量,可信度acc(α→β),覆盖率cov(α→β),支持数sup(α→β)由下式给出:   式中card(#9642;)指集合的基。直观地讲,可信度表示运用该规则进行推理正确的概率;覆盖率表示该规则的支持数在相应的决策类中的比重;支持数表示在论域中支持该规则的元素的个数。在数据挖掘时, 当然希望得到可信度和覆盖率都高的有效规则,但实际上这两个指标是成负关系的。所以,需要权衡规则的可信度和覆盖率来评价其价值。   下面建立基于粗糙集得续保规则模型:   为对车险保单数据进行续保规则的挖掘,借助基于粗糙集得软件ROSETTA来进行。   (1)数据准备,数据补缺和离散化。由于数据还原情况较为充足,且连续数据(如车龄,购买价格等)已离散化,所以此步骤天然完成。   (2)属性的简约,由于现实的数据中往往存在噪音和不一致性,为提高抗干扰能力,采用VPRS,其中β=0.5,运用ROSETTA中的遗传算法进行约简   (3)续保规则的产生及过滤。在上述约简产生的基础上,运用ROSETTA产生续保规则,在未做任何限定的情况下,ROSETTA将所有可能的规则都显示出来。   上面运用粗糙集理论来挖掘保单数据中的续保规则,可见,支持率可以作为确定续保的可能程度的衡量。   四、灰色关联度分析   1.数据变换技术。为保证建模的质量与系统分析的正确结果,对原始数据必须进行数据变换和处理,使其消除量纲和具有可比性。   定义 设有序列 x (x(1),x(2),…,x(n))   则称映射f :x→y    f (x(k))→y (k), k=1,2,…,n   为序列x到序列y的数据变换。   这里由于数据不是单调次序的,我们采用均值化变换:   2.指标量化。诸如车辆承保渠道,车辆使用性质等因素其集合所含元素为非数字化元素,此时将其非量化的数字特征用其对应的续保率替换,既能代表每个因素中的各小项的特征,有可量化用于关联度分析。   则 ,n=1000 通过上述步骤转化为    ,

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档