- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
广义线性模型与分类费率的厘定 - 上海财经大学金融学院
广义线性模型与汽车保险费率厘定
胡三明
西南财经大学保险学院
【摘 要】本文回顾了汽车保险费率厘定模型的发展历程,并对广义线性模型从建模、统计分析、模型的选择与诊断等方面进行了比较系统的介绍,最后通过一个汽车保险的实例来介绍其在分类费率厘定过程中具体运用,具有较强的实践意义。
【关键词】广义线性模型 分类费率厘定
一、导论
对于传统费率厘定模型,精算师过于依赖简单的单因素分析法和双因素分析法,其中,单因素分析常受到费率因子间相关性的影响而被扭曲,同时也没有考虑到因子间独立性的影响。对此,精算师在六十年代探索出了迭代GLM)是传统线性模型以及许多最常见的最小偏差法的延伸,从技术角度看,比标准的迭代i
其中是响应变量的第i次观测,是协变量,表示第 i 次观测数据,未知系数向量通过对数据的最小二乘拟合估计出来。假定i是均值为零,方差为常数的独立正态随机变量。对于一般的线性回归模型(LM)i可以分解为三个要素:
LM1:随机要素,即Y服从正态分布,;
LM2:系统要素,;
LM3:连接要素,;
(二)、广义线性模型
尽管传统的线性模型广泛地应用于统计数据分析中,但它却不适合处理如下几类问题:
(1) 将数据分布假设为正态分布并不合理;
(2) 当数据的均值被限制在一定的范围内时,传统的线性模型就不适用了,因为线性预测值可以取任意值;
(3) 假定数据的方差对于所有观测都是一个常数并不现实。
广义线性模型扩展了传统的线性模型,因此它适用于更广范围的数据分析问题。一个广义线性模型包括以下组成部分:
GLM1:随机要素,Y服从比正态分布更一般的分布,即指数族分布;
GLM2:系统要素同LM2,即保持线性结构;
GLM3:连接要素,其中g为严格单调可微的函数,称为连接函数。
GLM的通常表述如下:
其中::响应变量向量;:连接函数;:自变量矩阵;:待估计的参数向量;:干扰项向量;:方差函数的散布参数;:方差函数;:信度或权重;、、和依赖于对已知数据的处理,和则根据事先设定的模型得出,而或为已知,或为估计值。
1、指数族分布
设Y为随机变量,若其密度函数为:
其中a( )、b( )、c( )为已知函数,称为典型参数,称为散度参数。由Y的对数似然可以计算得:
Y的方差是的二阶导数与的积,只依赖于典型参数,因而只依赖于,所以,一般记的二阶导数为,并称为方差函数。此外,一般取,称为权数。
对于一个指数族分布,当确定后其分布形式即确定了,所以只要方差函数V确定了,对应的指数族的形式(如果存在)也就确定了。常见的几种分布都属于指数族,如下所示:
表一、常见指数族分布参数表
分布形式 参数 Normal 1 Poisson 1 Gamma Binomial Inverse Gaussian
2、连接函数
连接函数是用来描述系统要素与随机要素期望值之间关系的函数形式。作为连接函数必须严格单调且充分光滑,即有足够阶数的导数。
(由于:)
当时,上式可以简化为
我们称之为自然连接函数,其最重要的优点在于它使广义线性模型下统计推断的大样本理论变得更易于处理。当然,实际处理过程中,连接函数的选取主要取决于问题本身。
3、参数估计
设,,…, 独立同分布,服从指数族分布:
则(,,…,)的对数似然函数为:
由于:
则:
4、假设检验
同一般回归分析一样,广义线性模型的选择以及解释变量的显著性检验问题都可化为线性假设检验:
原假设 备择假设 ,其中为P维, C为已知的r×p行满秩常数矩阵。
(1)、Wald检验
检验统计量为:
这里,为的极大似然估计,为的估计。
当原假设成立时,即,带入,得:
于是
,因此,当时,拒绝原假设。
(2)、约束检验
以记为原假设约束条件下的MLE(极大似然估计)。
构建统计量:
当大于某个常数时,拒绝原假设。
此检验的直观背景如下:因为,若原假设成立,则和均为的估计,理应比较接近,因此,,这时取很小的值。反之,取较大的值。可以证明,当原假设成立,且满足一定的条件时,有:
,
因此,上文所提及的常数可取, 为给定的置信水平。
(3)、拟似然比检验
以记为对数似然函数,则和分别为的不受任何约束的MLE以及受到原假设约束的MLE。检验统计量为:
因为为的最大值,总有0。若原假设成立,则和均为的相合估计,理应比较接近,倾向于小;反之,倾向于大。可以证明,当原假设成立,有:
因此,上文所提及的常数可取为检验的否定域。 为给定的置信水平。
三、应用探讨
1、数据情况说明
下表是某保险公司汽车保险的历史理赔资料,从表中我们不难看出,影响该公司汽车保险费用的因素主要有三类,分别是:被保险人的年龄、车型和车龄。其中被保险人的年龄又细分为17-20、21-24、25-29、30-
文档评论(0)