- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广义线性型与汽车保险费率厘定
广义线性模型与汽车保险费率厘定
胡三明
西南财经大学保险学院
【摘 要】本文回顾了汽车保险费率厘定模型的发展历程,并对广义线性模型从建模、统计分析、模型的选择与诊断等方面进行了比较系统的介绍,最后通过一个汽车保险的实例来介绍其在分类费率厘定过程中具体运用,具有较强的实践意义。
【关键词】广义线性模型 分类费率厘定
一、导论
对于传统费率厘定模型,精算师过于依赖简单的单因素分析法和双因素分析法,其中,单因素分析常受到费率因子间相关性的影响而被扭曲,同时也没有考虑到因子间独立性的影响。对此,精算师在六十年代探索出了迭代模型——最小偏差法,使其得到重大的改进,但仍然没有形成完整的统计框架。最小偏差法试图通过迭代的方法来求出一系列方程的最优解,但它无法测试一个特定的变量的影响效果,同时也不能提供可靠的参数估计范围。
广义线性模型(GLM)是传统线性模型以及许多最常见的最小偏差法的延伸,从技术角度看,比标准的迭代模型更有效率,它提供的统计诊断功能,有助于挑选重要的变量并且确认模型的假设条件。如今,广义线性模型在欧盟和许多其他市场,被公认为是对私家车和其他私人业务以及小额的团体业务进行定价的行业标准模型。
广义线性模型的个别特例很早就已出现,早在1919年就曾被Fisher使用过,二十世纪四五十年代,Berkson,Dyke和Patterson等人使用过最著名的Logistic模型,1972年Nelder和Wedderburn在一篇论文中率先使用广义线性模型一词,此后相关研究工作逐渐增加,1983年McCullagh和Nelder出版了系统的论著,并于1989年再版。
二、广义线性模型
(一)、线性模型
一个传统的线性模型具有如下形式:
i
其中是响应变量的第i次观测,是协变量,表示第 i 次观测数据,未知系数向量通过对数据的最小二乘拟合估计出来。假定i是均值为零,方差为常数的独立正态随机变量。对于一般的线性回归模型(LM)i可以分解为三个要素:
LM1:随机要素,即Y服从正态分布,;
LM2:系统要素,;
LM3:连接要素,;
(二)、广义线性模型
尽管传统的线性模型广泛地应用于统计数据分析中,但它却不适合处理如下几类问题:
(1) 将数据分布假设为正态分布并不合理;
(2) 当数据的均值被限制在一定的范围内时,传统的线性模型就不适用了,因为线性预测值可以取任意值;
(3) 假定数据的方差对于所有观测都是一个常数并不现实。
广义线性模型扩展了传统的线性模型,因此它适用于更广范围的数据分析问题。一个广义线性模型包括以下组成部分:
GLM1:随机要素,Y服从比正态分布更一般的分布,即指数族分布;
GLM2:系统要素同LM2,即保持线性结构;
GLM3:连接要素,其中g为严格单调可微的函数,称为连接函数。
GLM的通常表述如下:
其中::响应变量向量;:连接函数;:自变量矩阵;:待估计的参数向量;:干扰项向量;:方差函数的散布参数;:方差函数;:信度或权重;、、和依赖于对已知数据的处理,和则根据事先设定的模型得出,而或为已知,或为估计值。
1、指数族分布
设Y为随机变量,若其密度函数为:
其中a( )、b( )、c( )为已知函数,称为典型参数,称为散度参数。由Y的对数似然可以计算得:
Y的方差是的二阶导数与的积,只依赖于典型参数,因而只依赖于,所以,一般记的二阶导数为,并称为方差函数。此外,一般取,称为权数。
对于一个指数族分布,当确定后其分布形式即确定了,所以只要方差函数V确定了,对应的指数族的形式(如果存在)也就确定了。常见的几种分布都属于指数族,如下所示:
表一、常见指数族分布参数表
分布形式
参数
N
1
Poisson
1
Gamma
Binomial
Inverse Gaussian
2、连接函数
连接函数是用来描述系统要素与随机要素期望值之间关系的函数形式。作为连接函数必须严格单调且充分光滑,即有足够阶数的导数。
(由于:)
当时,上式可以简化为
我们称之为自然连接函数,其最重要的优点在于它使广义线性模型下统计推断的大样本理论变得更易于处理。当然,实际处理过程中,连接函数的选取主要取决于问题本身。
3、参数估计
设,,…, 独立同分布,服从指数族分布:
则(,,…,)的对数似然函数为:
由于:
则:
4、假设检验
同一般回归分析一样,广义线性模型的选择以及解释变量的显著性检验问题都可化为线性假设检验:
原假设 备择假设 ,其中为P维, C为已知的r×p行满秩常数矩阵。
(1)、Wald检验
检验统计量为:
这里,为的极大似然估计,为的估计。
当原假设成立时,即,带入,得:
于是
,因此,当时,拒绝原假设。
(2)、约束检验
以记为原假设约束条件下的MLE(极大似然估计)。
构建统计量:
当大于某个常数
文档评论(0)