数据挖掘和分析WB精要.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘和分析WB精要.ppt

广义线性模型 2014.11.14 第十二周 广义线性模型 广义线性模型 标准线性模型: 广义线性模型: 广义线性模型:glm() glm(formla,family=family(link=function),data= ) 表13-1 glm()的参数 分布族+默认的连接函数 如:glm(Y~X1+X2+X3,family=gaussian(link=“identity”),data=mydata ) 与下列函数连用: summary(), coefficeints(), coef(), confint(), residuals(), anova(), plot(), predict() 广义线性模型: 模型拟合和诊断 评价模型适用性: ? 响应变量的预测值与残差图 plot(predict(model,type=response), residual(model, type=deviance)) 帽子值、学生化残差值、Cook距离统计量... 综合性诊断图(car::influencePlot) 广义线性模型:Logistic回归 适用于二值型响应变量(0,1) glm(Y~X1+X2+X3,family=binomial(link=“logit”),data=mydata ) 广义线性模型:Logistic回归 通过一系列连续和/或类别型变量预测二值型结果变量(例:婚外情数据 Fairs Affair) 犯错的频率~性别+年龄+婚龄+是否有小孩+宗教+学历+职业+婚姻的自我评分 广义线性模型:Logistic回归 广义线性模型:Logistic回归 广义线性模型:Logistic回归 广义线性模型:Logistic回归 fit full model 广义线性模型:Logistic回归 fit reduced 广义线性模型:Logistic回归 比较full和reduced 广义线性模型:Logistic回归 解释模型参数 由连接函数:响应变量--优势比 固定其他变量某预测变量单位变化引起的优势比变化--Y=1的概率 广义线性模型:Logistic回归 模型预测 广义线性模型:Logistic回归 模型预测 广义线性模型:Logistic回归 过度离势overdispersion 过度离势:观测到的响应变量的方差大于期望的二项分布的方差,导致奇异的标注误检验和不精确的显著性检验 残差偏差/残差自由度~1 广义线性模型:Logistic回归,扩展 稳健Logistic回归(robust::glmRob) 多项式分布回归(mlogit::mlogit())响应变量包含两个以上无序类别 序数Logistic回归(rms::lrm()) 响应变量有序 广义线性模型:泊松回归 适用于计数型变量 glm(Y~X1+X2+X3,family=binomial(link=“logit”),data=mydata ) 广义线性模型:泊松回归 通过一系列连续和/或类别型变量预测计数型结果变量(例:抗癫痫药物对癫痫病发数的影响) 广义线性模型:泊松回归 广义线性模型:泊松回归 广义线性模型:泊松回归 解释模型参数 广义线性模型:泊松回归 过度离势 处理计数型数据时经常发生 遗漏的某个重要变量 事件可能相关(下一次发病的几率) 纵向数据(panel data,重复测量数据)的内在群聚特性导致 本例:残差偏差/残差自由度=559.44/55=10.17 过度离势检验 广义线性模型:泊松回归 过度离势 广义线性模型:泊松回归 扩展 时间段变化的泊松回归 fit-glm(sumY ~ Base + Age + Trt, data = breslow.dat, offset=log(time), family = poisson()) 零膨胀的泊松回归(pscl::zeroinfl()) 同时拟合两个模型:预测是否发生+预测排除了结构零值者后发生次数 稳健泊松回归(robust::glmRob) fit.od - glm(sumY ~ Base + Age + Trt, data = breslow.dat, + family = quasipoisson()) summary(fit.od) Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 1.948826 0.465091 4.190 0.000102 *** Base 0.022652 0.001747 12.969 2e-16 *** Age 0.0

文档评论(0)

love + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档