索赔次数分布拟合与应用.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
索赔次数分布拟合与应用

索赔次数分布的拟合与应用 韩天雄 华东师范大学统计系 §1 索赔次数分布 风险有两个主要因素:其一是在一定期内危险事故可能发生的次数,即索赔次数;其二是每次事故可能损失的大小,即索赔金额。这两个量都是不确定的,它们各自反映了风险的可能性的严重性。风险的数量特征是在这两个量的乘积中得到体现的,因此它也具有不确定性。我们将通过实例来介绍如何确定索赔次数分布。 表1的资料取自Johnson与Hey的论文(1971),它记述了1968年英国的421240张机动车综合保险单中的0,1,2,3,4,5次索赔频率数。 表1:索赔频率数 索赔次数x 观察到的保单数m 0 370412 1 46545 2 3935 3 317 4 28 5 3 计算可得,索赔次数平均值 ,方差。 当索赔事件满足下列三个假定: 1°每一时间区间中索赔次数是相互独立的。 2°一次事故仅有一次索赔。 3°事故发生的确切时间是不确定的。 我们有把握的说,索赔次数服从泊松分布。此时,索赔次数k的概率: 其中n为参数。按照泊松分布的性质,它的均值与方差都为n。利用这个性质与表1的资料,我们将索赔次数拟合成以参数n=0.13174的泊松分布。利用概率公式以及递推公式 ,可计算出索赔次数k=0,1,2,3,4,5的概率值: 将这些概率值乘上保单数目421240,则得到了泊松分布条件下索赔频数(见表2)。从表中可见,拟合得并不理想。显而易见的事实是,表1资料中得到的索赔次数均值0.13174与方差0.13852不等,所以它只能是近似地服从泊松分布。而深层次的原因是索赔事件未能完全满足三个假定。例如,在恶劣的气候条件下,路况变坏,那么很难保证索赔次数独立性假定。另外,汽车相撞事件也使条件2°不能成立。在索赔次数均值为0.13174的421240张保单中,最可能的事实是风险的不同质,即某些保单持有人风险状况很糟,而另一些持有人风险状况很好。它与汽车类型、用途、使用时间、行驶里程和驾驶技术有关。用负二项分布来描述非同质的索赔次数分布是常见的。负二项分布索赔次数k的概率: ,(k=0,1,2,…)其中a,P为参数。按照负二项分布的性质,其均值和方差分别为和。利用这个性质和表1的资料,我们将索赔次数拟合成负二项分布。具体操作方法为: 令 将第一式除以第二式可计算出参数P=0.9510539,再代入原式求出参数a=2.5597912。 利用概率公式: 以及由它而导出的递推公式: 可计算出在负二项分布条件下,索赔次数k=0,1,2,3,4,5的概率值: 将这些概率值乘上保单数421240,得到了负二项分布条件下索赔频数(表2),很明显,它提供了比泊松分布更好的拟合。 表2:机动车综合保险索赔次数分布 索赔次数 观察到的保单数目 拟合的频数 泊 松 负二项 混合 泊松 0 370412 369246 370460 370460 1 46545 48644 46411 46418 2 3935 3204 4045 4036 3 317 141 301 306 4 28 5 21 20 5 3 0 1 1 描述风险不同质的另一常用技术是混合泊松分布方法,以本文所提到的英国机动车辆综合保险为例,虽然平均索赔次数为0.13174,但是天气状况明显影响索赔次数的均值。譬如,下雪天平均索赔次数将为平常的q1倍(如q1=3),而全年中下雪天概率为h1(如h1=0.03);下雨天平均索赔次数为平常的q2倍(如q2=1.2),而全年下雨的概率为h2(如h2=0.2);晴天平均索赔次数仅为平常的q3倍(如q3=0.87),而全年晴天的概率为h3(如h3=0.77)。上述情况可记为: 我们称q为混合变量。按照概率论,我们要求,并且即有: 引入混合变量q后的分布称为混合泊松分布。全年索赔次数分布可看作雪天服从参数为nq1的泊松分布,雨天服从参数为nq2的泊松分布和晴天服从参数为nq3的泊松分布的组合。在混合泊松分布中,可以证明均值为n,方差为索赔次数k的概率公式: 。 有人曾经用表1的资料,利用,,均值n方差及概率公式求出参数(此处混合变量q仅取二个值): q1=0.65341 h1=0.76519 q2=2.1293 h2=0.23481 则 k=0,1,2,3,4,5 同样,将所得概率值乘保单数421240得到混合泊松分布条件下索赔数(表2),从表中比较可见,拟合情况略好于负二项分布。一般而言,当混合变量q取值越多时,拟合的结果将更令人满意。当然,计算量也将随之增加。 研究索赔次数的分布,它的优越性在于分布仅由少量参数所概括,而不必再与冗长的观察数据打交道。即

文档评论(0)

sy78219 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档