孟生旺广义线性模型发展与应用.pptxVIP

  • 10
  • 0
  • 约4.01千字
  • 约 35页
  • 2020-02-17 发布于上海
  • 举报
主要内容基本的广义线性模型:理论与应用模型评价费率约束广义线性模型的推广与应用分布假设的推广GAM与GAMLSS(GAM for Location, Scale and Shape)神经网络与回归树应用案例基本GLM:理论与应用分布假设:正态泊松、负二项:索赔频率伽马、逆高斯:索赔强度Tweedie:纯保费二项:续保率连接函数:恒等:加法模型对数:乘法模型,预测值大于零logit:预测值在(0,1)区间Tweedie、泊松和伽马的比较:Tweedie:泊松:p=1伽马:p=2模型评价1:偏差近似服从自由度为n - p的卡方分布。除泊松外,效果不是很好。对于嵌套模型,偏差之差近似服从 p - q 的卡方分布,近似效果较好。注:SAS中称fD为偏差,称D为尺度偏差。模型评价2:残差(下页图示)Anscobe残差:Deviance残差:若分布假设是合理的,标准化处理后近似服从标准正态分布。若偏差di的绝对值大于1,说明对这个观察值的拟合效果较差。 模型评价3:Type 1 和 Type 3 分析LR Statistics For Type 1 Analysis 2*LogSource Likelihood DF Chi- Sq Pr Chi-SqIntercept -1456.5376OwnerAge -1438.7844 7 17.75 0.0131Model -1370.3694 3 68.41.0001CarAge -1247.8460 3 122.52.0001LR Statistics For Type 3 Analysis Source DF Chi- Sq Pr Chi-SqOwnerAge 7 52.81.0001Model 3 100.54.0001CarAge 3 122.52.0001 模型评价4:标准误、置信区间和p值 Analysis Of Maximum Likelihood Parameter EstimatesParameterDFEstimateStandard ErrorWald 95% Confidence LimitsWald Chi-SquarePr??ChisqIntercept15.13380.06375.0090585.0001OwnerAge17-2010.22630.11070.00940.44334.180.0409OwnerAge21-2410.22870.05980.11150.345914.630.0001OwnerAge25-2910.16420.04380.07830.250214.040.0002OwnerAge30-3410.11430.04200.03210.19667.430.0064OwnerAge35-391-0.08770.0411-0.1684-0.00714.540.0330OwnerAge40-491-0.01290.0358-0.08310.05740.130.7197OwnerAge50-5910.00690.0372-0.06610.07990.030.8536OwnerAge60+00.00000.00000.00000.0000..CarAge0-310.69900.05160.59780.8002183.32.0001CarAge4-710.61300.05160.51190.7141141.33.0001CarAge8-910.35580.05980.23860.473035.43.0001CarAgez10+00.00000.00000.00000.0000..Scale10.98520.12340.77071.2594模型评价5:把样本数据分为三组(数据充足)训练样本(training data)测试样本(test data)评价样本(validation data)模型评价6:Box-Cox检验来源:Anderson etc.(2007), Practitioners’ guide to GLM模型比较:信息准则AIC或BIC的值越小越好。误差平方和的比较? GLM的优缺点优点:统计检验处理相关性和交互作用(见下页)现成软件缺点:无法处理加法和乘法的混合模型参数模型,函数形式有限寻找交互项:耗时 费率约束的处理费率约束:A区域的费率系数不超过1.20B区域的费率系数

文档评论(0)

1亿VIP精品文档

相关文档