- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
索赔次数分布拟合与应用
索赔次数分布的拟合与应用
韩天雄
华东师范大学统计系
§1 索赔次数分布
风险有两个主要因素:其一是在一定期内危险事故可能发生的次数,即索赔次数;其二是每次事故可能损失的大小,即索赔金额。这两个量都是不确定的,它们各自反映了风险的可能性的严重性。风险的数量特征是在这两个量的乘积中得到体现的,因此它也具有不确定性。我们将通过实例来介绍如何确定索赔次数分布。
表1的资料取自Johnson与Hey的论文(1971),它记述了1968年英国的421240张机动车综合保险单中的0,1,2,3,4,5次索赔频率数。
表1:索赔频率数
索赔次数x
观察到的保单数m
0
370412
1
46545
2
3935
3
317
4
28
5
3
计算可得,索赔次数平均值 ,方差。
当索赔事件满足下列三个假定:
1°每一时间区间中索赔次数是相互独立的。
2°一次事故仅有一次索赔。
3°事故发生的确切时间是不确定的。
我们有把握的说,索赔次数服从泊松分布。此时,索赔次数k的概率:
其中n为参数。按照泊松分布的性质,它的均值与方差都为n。利用这个性质与表1的资料,我们将索赔次数拟合成以参数n=0.13174的泊松分布。利用概率公式以及递推公式 ,可计算出索赔次数k=0,1,2,3,4,5的概率值:
将这些概率值乘上保单数目421240,则得到了泊松分布条件下索赔频数(见表2)。从表中可见,拟合得并不理想。显而易见的事实是,表1资料中得到的索赔次数均值0.13174与方差0.13852不等,所以它只能是近似地服从泊松分布。而深层次的原因是索赔事件未能完全满足三个假定。例如,在恶劣的气候条件下,路况变坏,那么很难保证索赔次数独立性假定。另外,汽车相撞事件也使条件2°不能成立。在索赔次数均值为0.13174的421240张保单中,最可能的事实是风险的不同质,即某些保单持有人风险状况很糟,而另一些持有人风险状况很好。它与汽车类型、用途、使用时间、行驶里程和驾驶技术有关。用负二项分布来描述非同质的索赔次数分布是常见的。负二项分布索赔次数k的概率:
,(k=0,1,2,…)其中a,P为参数。按照负二项分布的性质,其均值和方差分别为和。利用这个性质和表1的资料,我们将索赔次数拟合成负二项分布。具体操作方法为:
令
将第一式除以第二式可计算出参数P=0.9510539,再代入原式求出参数a=2.5597912。
利用概率公式:
以及由它而导出的递推公式:
可计算出在负二项分布条件下,索赔次数k=0,1,2,3,4,5的概率值:
将这些概率值乘上保单数421240,得到了负二项分布条件下索赔频数(表2),很明显,它提供了比泊松分布更好的拟合。
表2:机动车综合保险索赔次数分布
索赔次数
观察到的保单数目
拟合的频数
泊 松
负二项
混合
泊松
0
370412
369246
370460
370460
1
46545
48644
46411
46418
2
3935
3204
4045
4036
3
317
141
301
306
4
28
5
21
20
5
3
0
1
1
描述风险不同质的另一常用技术是混合泊松分布方法,以本文所提到的英国机动车辆综合保险为例,虽然平均索赔次数为0.13174,但是天气状况明显影响索赔次数的均值。譬如,下雪天平均索赔次数将为平常的q1倍(如q1=3),而全年中下雪天概率为h1(如h1=0.03);下雨天平均索赔次数为平常的q2倍(如q2=1.2),而全年下雨的概率为h2(如h2=0.2);晴天平均索赔次数仅为平常的q3倍(如q3=0.87),而全年晴天的概率为h3(如h3=0.77)。上述情况可记为:
我们称q为混合变量。按照概率论,我们要求,并且即有:
引入混合变量q后的分布称为混合泊松分布。全年索赔次数分布可看作雪天服从参数为nq1的泊松分布,雨天服从参数为nq2的泊松分布和晴天服从参数为nq3的泊松分布的组合。在混合泊松分布中,可以证明均值为n,方差为索赔次数k的概率公式:
。
有人曾经用表1的资料,利用,,均值n方差及概率公式求出参数(此处混合变量q仅取二个值):
q1=0.65341 h1=0.76519
q2=2.1293 h2=0.23481
则
k=0,1,2,3,4,5
同样,将所得概率值乘保单数421240得到混合泊松分布条件下索赔数(表2),从表中比较可见,拟合情况略好于负二项分布。一般而言,当混合变量q取值越多时,拟合的结果将更令人满意。当然,计算量也将随之增加。
研究索赔次数的分布,它的优越性在于分布仅由少量参数所概括,而不必再与冗长的观察数据打交道。即
您可能关注的文档
最近下载
- 浮力单元作业设计.pdf VIP
- GB∕T 12274.401-2023 有质量评定的石英晶体振荡器 第4-1部分:空白详细规范 能力批准.pdf
- 大学生的创新创业大赛.pptx
- 2024年新版党建知识应知应会系列测试.docx VIP
- 第二章 田径——立定跳远 课件 2023-2024学年人教版初中体育与健康七年级全一册.pptx VIP
- 《浮力》单元作业设计.pdf VIP
- 保洁、环卫、绿化养护工劳动定额标准QFSSHRS012019.doc.docx
- 国外中学生涯教育现状与国内本土化进展相关论文背景分析.docx
- 北合小学美术教研组活动记录表.pdf
- 《中国共产党纪律处分条例》测试题.doc VIP
文档评论(0)