第八章logistic回归分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
建立数据文件 别忘加权 分析?回归?有序(Ordinal) 在输出—平行线检验划勾,其他默认。 平行线检验表示不管反应变量的分割点在什么位置,模型中各自变量的系数都保持不变 选项、位置及度量为默认即可 分析结果: 说明各种取值水平组合中有多少其观察频数为0。如果有连续性变量,这个比例会较大。 变量各水平的例数 似然比检验:模型中自变量偏回归系数是否全为0(原假设全为0)。 结果P=0.000,拒绝原假设,说明至少有一个自变量的偏回归系数不为0。 拟合优度检验:各种取值水平组合中其观察频数为0的比例较高时,该检验不可靠。本例P 值均大于0.05,拟合较好。 伪决定系数:分类数据,该系数一般不会太高。 经平行线检验,?2=1.469,P=0.480。 可认为:不管反应变量的分割点在什么位置,模型中各自变量的系数都保持不变。该资料适合用有序多分类Logistic回归模型。 参数估计 无效,有效,显效?无效与有效显效,无效有效与显效,可建立两个方程。 OR=exp(?) 不同促销方法的OR值为exp(1.797)=6.03。新促销方法优于传统促销方法。效果至少优于1个等级的可能性,新促销方法是传统促销方法的6.03倍。 不同性别的OR值为exp(-1.319)=0.27。男性的效果比女性差。效果至少优于1个等级的可能性,男性是女性的0.27倍。 不同性别和促销方法对某产品销售效果*的影响 影响因素 OR P OR 95% CI 性别:男性 女性 0.27 1.00 0.013 0.09~0.75 疗法:新促销方法 传统促销方法 6.03 1.00 0.000 2.39~15.24 *效果分3个等级 1:无效;2:有效;3:显效 有序Probit模型的基本原理 设变量Zi =α+βXi是不可观测的,但是我们能够区别Zi 值的大小所属的区间。 则可以根据某种已知分布,将Zi 与所处区间的概率相关联,然后利用各个区间的样本概率,通过最大似然估计获得对参数α和β的估计。 单一解释变量 、多变量 的Probit过程的具体 形式分别为 其中, 分别为标准正态分布的分布函数 与密度函数。 对Probit过程的参数估计同样采用极大似然估计法, 因此在构建Probit过程时要求样本采取随机抽取方式抽 取,即要求样本分布与总体分布具有同一性。对 个 样本数据 ,模型的对数似然函数为: 模型参数的极大似然估计就是选择使对数函数达到 最大时的 的值。 比如用有序Probit方法模型分析自我健康的评价情况 输入为影响健康的因素x1i ~xmi构成的向量Xi,输出为自我健康的自我评价值yi 。因为yi为分类变量,因此定义一个连续隐式变量 Φi,它应是yi的映射。此变量符合普通最小二乘法的条件,可与Xi构成线性关系: 案例:剂量与死亡数的关系-probit回归分析 可得模型方程式PROBT(p)=-4.347+0.021X 模型拟合效果较好 上表结果为各剂量组的观察值与期望值,并给出了残差与概率(期望值占总观察数的百分比) 左表是不同死亡概率多对应的剂量,及其95%的置信区间。可见半数致死剂量为210.02mg。 将上面的关系式代入下式 用该方程可以做预测,预测值大于0.5说明此人可能会得癌症,小于0.5说明可能不会得癌症。 如某人即抽烟(抽烟=1)又喝酒 (喝酒-1) 则其得癌症得概率: logistic回归模型的假设检验 根据样本得到的logistic回归模型还需经过检验才能说明影响因素对事件发生的影响是否具有统计学意义。 假设检验的假设有两种: H0:?1=?2=……= ? m(将多个影响因素作为一个整体考虑) H0:?j=0(单独检验某个影响因素) logistic回归模型的假设检验方法 似然比检验(likelihood ratio test):既适合单个影响因素的假设检验,又适合多个影响因素的同时检验; Wald检验(Wald test):适合单个影响因素的检验; 似然比检验的基本思想 比较包含需检验影响因素的模型和不包含该影响因素的模型,如果检验结果为拒绝H0,则表示该影响因素对回归模型有统计学意义,即对事件发生有影响。反之,则没有统计学意义,对事件发生没有影响。 似然比检验 G1= 2lnL(X2) -2lnL(X1,X2)=35.45 G2=2 lnL(X1 ) -2lnL(X1,X2)=11.23 ?20.05,1=3.84, G1>?20.05,1, G2>?20.05,1,拒绝原假设 结论:扣除饮酒因素后,吸烟对食管癌的发生有影响;扣除吸烟因素后,饮酒对食管癌有影响。 Wald检验 结论:食管癌与吸烟、饮酒有关。 多类logistic回归

文档评论(0)

beautyeve + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档