网站大量收购独家精品文档,联系QQ:2885784924

Logistic 回归课程.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
拟和优度 m=x变量的水平数,(对冠心病的例子m=5) ni=x变量第i水平的观测记录数 K=参数的数量(对冠心病的例子k=2) 拟和优度   对于连续型预测变量,我们需要 Hosmer-Lemshow 拟和优度检验 Hosmer-Lemshow 统计量计算拟和优度时把自变量的范围划分为10个有序组,比较每一组实际的记录数量(观测到的)以及logistic回归模型预测的记录数量(预测的)。因此检验统计量是卡方统计量,期望的结果是不显著,这表明模型预测和观测并没有显著区别。 例子:冠心病数据 该数据集合包括n=100条观测记录 每一条记录写成一行,数据如下页。 * * * * * * * * * * * * Logistic 回归 李保坤老师 西南财经大学 统计学院 本节内容提要 Logistic 回归模型 关于 Odds 和 Odds Ratio Logistic回归模型的解释 参数估计 假设检验 使用SAS的一个例子 Logistic 回归模型 模型关系的一边是一系列的变量xi 二元变量 (是/否) 类别变量(社会等级,... ) 连续变量(年龄, ...) 另一边是 二元变量 Y 二元输出是商业,生物学和流行病学中经常出现的情况 Logistic 回归模型 表1 年龄(Age)和冠心病(CD)发病情况 Logistic 回归模型 比较病人和非病人的平均年龄 非病人: 38.6 岁 病人: 58.7 岁 能不能用线形回归? 表1数据的散点图 冠心病症状 年龄 Logistic 回归模型 表2 按年龄组划分的冠心病发病情况 年龄组 人数 冠心病人数 累积% 表2数据的散点图 年龄组 病人百分数 Logistic 回归模型 x 得病概率 转换 logit of P(y|x) { a = 非感染区疾病的概率比对数(log odds) b = 感染区疾病的概率比对数的单位变化率 e b = 概率比变化率 关于 Odds 和 Odds Ratio 例子:在一个具有17个家庭的样本里,共有3家的收入为¥10000,5家的收入为¥11000,9家的收入为¥12000。在收入为¥10000的家庭里,1个主妇不工作,2个主妇工作;在收入为¥11000的家庭里,1个主妇不工作,4个主妇工作;在收入为¥12000的家庭里,1个主妇不工作,8个主妇工作。 收入 主妇工作状况 总计 0(不工作) 1(工作) 10 11 12 1 1 1 2 4 8 3 5 9 总计 3 14 17 关于 Odds 和 Odds Ratio 主妇工作的Odds 收入 主妇工作状况 工作的Odds 0(不工作) 1(工作) 10 11 12 1 1 1 2 4 8 2/1=2 4/1=4 8/1=8 关于 Odds 和 Odds Ratio 用收入为¥11000家庭的主妇工作的Odds除以收入为¥10000家庭的主妇工作的Odds,我们会得到4/2=2。 用收入为¥12000家庭的主妇工作的Odds除以收入为¥11000家庭的主妇工作的Odds,我们得到8/4=2。 注意:当收入增加1个单位(¥1000)工作的Odds增加到原来的2倍。Odds Ratio=2 在这个例子中,我们把收入每增加1个单位,主妇工作的Odds增加到原来的2倍。 Logistic回归模型的解释 可以把结果变量Y看作一个贝努里实验, E(Y)=π π是每一个实验成功的概率 π的值在0和1之间 Logistic回归模型的解释 多元线性回归模型 不适合用于二元结果变量,因为线性回归模型假定结果变量可以取任意值,而事实上只能取0到1之间的数值. 这时我们使用Logistic回归模型 Logistic回归模型的解释 这个比率 被称作概率比(odds), 它是π的函数 Logistic回归模型的解释 对于只有一个预测变量的情况: X每增加1, odds增加eβ Logistic回归模型的解释 Logistic回归模型的解释 因此, eβ是Odds Ratio eβ =1,对应的是β =0, 它表示对应的预测变量x和结果变量y没有关系 Logistic回归模型的解释 对于只有一个预测变量x,使用样本数据得到模型: π的估计为 参数估计 线形回归: 最小二乘 Logistic回归: 极大似然估计 似然函数 估计参数 a 和 b 通常使用对数似然函数更为简单 参数估计:最大似然估计 参数估计:最大似然估计 参数估计:最大似然估计 牛顿 - 纳逊方法,Newton-Raphson 参数估计:最大似然估计 变量编码 名义变量或有序变量: 烟草消费

文档评论(0)

hushuidhd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档