有序多分类逻辑斯蒂回归模型课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
;第14章 有序回归 (有序多分类因变量Logistic回归);研究中常遇到反应变量为有序多分类(k2)的资料,如城市综合竞争力等级、满意度等可以划分为低、中、高。 与名义多分类因变量有所不同,定性有序多分类因变量采用累积logit模型,该模型可利用有序这一特点,得到比基线-类别有更简单解释的模型。 Y的累积概率是指Y落在一个特定点的概率,对结果为类别j时,其累积概率为: 累积概率满足: 累积概率的模型并不利用最后一个概率,因为它必然等于1;pj = p(y≤j | x),它表示 y 取前 j 个值的累积概率。;第一个模型表示了y 取第一个值的概率p1与x的关系;第二个模型表示了y 取前两个值的累积概率p2与x的关系。这两个模型的常数项不同,回归系数完全相同的。 y 取第一个值的概率p(1)=p1 ,y 取第二个值的概率p(2)=p2 -p1,y 取第三个值的概率p(3)=1- p2 。它们的截距不同,斜率相同,所以是J-1条平行直线族。多值因变量logistic回归模型要求进行数据的平行性检验。 ;平行性检验(只适用于位置模型/位置参数/斜率系数) 当因变量维多值变量时,模型包含多个回归方程。Logistic回归分析要求这多个回归方程中自变量的系数是相等的。因此需要做平行行检验,也称为比例比数假设检验(test fo the proportional odds assumption),使用的方法是计分检验法。当Pa时,接受平行的原假设。否则,应该将因变量的某些值进行合并,减少因变量的取值个数,使得多值变量logistic回归模型平行性成立。还可以尝试其他链接函数。 如果各种连接函数都无法满足平行性假定,则需要考虑回归系数是否会随着分割点而发生改变。此时最好使用无序多分类的Logistic 回归进行模型拟合,然后再根据系数估计值考虑如何进行处理。;以4 水平的反应变量为例,假设反应变量的取值为1 、2 、3 、4 ,相应取值水平的概率为p1、p2、p3、p4,则此时进行Logit 变换的分别为p1、p1+p2、p1+p2 +p3,对k 个自变量拟合三个模型如下:;根据上述公式,可以分别求出:;由上述建立的模型可以看出,这种模型实际上是依次将反应变量按不同的取值水平分割成两个等级,对这两个等级建立反应变量为二分类的Logistic 回归模型。不管模型中反应变量的分割点在什么位置,模型中各自变量的系数都保持不变,所改变的只是常数项。此时求出的OR 值表示自变量每改变一个单位,反应变量提高一个及一个以上等级的比数比。 张文彤认为,这里拟合的模型中常数项之前的符号应当是“负号”,原因在于此处的常数项正好表示低级别和高级别相比的情况,且必然有 , 但由于研究者主要关心的是各参数(系数)的大小,因此这种差异影响不大。并且由SPSS给出的系数无需再添加符号。;某大学医院外科采用两种不同的绷带和两种不同的包扎方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有效和痊愈。试分析治疗方法对治疗效果的影响。 设因变量 y 表示治疗效果,0=不愈、1=有效、2=痊愈。设自变量x1表示绷带种类,自变量 x2 表示包扎方式。 对于多值因变量模型,平行性假设决定了每个自变量的OR值对于前k-1个模型是相同的。例如,变量x1的OR=5.172,它表示使用第一种绷带治愈腿溃疡的可能性是使用第二种绷带的5.172倍;它也表示使用第一种绷带至少有效的可能性是使用第二种绷带的5.172倍。;14.1 有序回归的基本思想; 位置结构模型(位置模型/定位模型):;;14.2 有序回归的案例分析;警告信息说明自变量的各种取??水平组合中有多少其观察频数为0 。由于数据库中变量age 为连续性变量,所以这个比例显得较大,此种情况下属于正常现象。;;;;14.2 有序回归的案例分析;链接:指定链接函数(联系函数、连接函数),即对模型估计中的累积概率的转换函数,根据因变量(反应变量)的情况选择 ;输出伪R方;位置模型设置:用于指定定位模型中的各种效应;尺度模型设置:设置与尺度模型有关的参数;案例处理摘要:可以看出,本例在链接函数的选择上,可以选择补充对数——对数,也可以选择Cauchit链接函数;主要输出结果;系数大都不够显著,原因可能是因变量的分类顺序不对,也可能是因为链接函数选择不理想。 若协变量的参数估计之为正,那么对此变量取值越大的观测目标类别取值也越大,如age变量显著且为正,表明年龄越大拖欠贷款的概率也越大。;平行检验:原假设是斜率系数(位置参数)在各响应类别中都是相等的。由于Pa,否定原假设,说明各回归方程不平行 如果平行性检验的P 值非常小,是不能就这样蒙混过关的。其主要原因是链接函数选择不准确,或者系数的确在随着分割点发生变化

文档评论(0)

130****8663 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档