- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 30
第十三章 分类资料回归分析(Regression)
13.1 分类资料回归分析方法概述
分类资料回归分析(regression of categorical data)是针对因变量为分类资料的一类回归分析方法, 。常用的Logistic类回归(Logistic regression)属于概率型非线性回归,是一类研究因变量为二分类或多分类观察指标与一些“危险因素”(自变量)间关系的多变量统计分析方法。本章主要介绍二分类Logistic回归、多分类Logistic回归、有序Logistic回归和概率单位回归。在医学科研或日常工作中,有关疾病的动物实验研究、临床试验研究和流行病学研究的许多资料如动物实验结果(生存与死亡)、健康体检结果(患病与未患病)、胃组织病理检查(胃炎、不典型增生、癌变)、病人治疗结果(治愈、显效、有效、无效)等均属于分类资料,这类资料是根据资料的类型、性质或属性分类后清点各组所得资料,根据分类情况可以分为无序分类(unordered categorical data)和有序分类资料(ordinal categorical data),无序分类资料可以分为二分类资料(binary categorical data)和多分类资料(multiple categorical data)。根据设计类型可以分为完全随机设计的成组资料和配对设计的配对资料。分类资料回归分析用Logistic回归分析, Logistic回归分析可以分为二分类Logistic回归分析(binary Logistic analysis)、多分类Logistic回归分析(multinomial Logistic analysis)和有序Logistic回归分析(ordinal Logistic analysis)等, 二分类Logistic回归分析可以分为非条件Logistic回归分析和条件Logistic回归分析,主要用于应变量为二分类资料。多分类Logistic回归分析主要用于应变量为无序多分类资料,有序Logistic回归分析主要用于有序多分类资料。
一、常用术语
1.回归系数假设检验统计量1.Logistic回归
Logistic回归(Logistic regression)是属于概率型非线性回归,适用于研究因变量为二分类或多分类观察指标与一些“危险因素”(自变量)间关系的多变量统计分析方法。
2.数量化或哑变量
数量化是将观察项目的内容用数值表示出来,如性别为研究的变量时,男性可用1表示,女性用2表示。将观察指标的内容重新用数值编码形成的变量称为哑变量(dummy variable),如年龄(实际数值)化为哑变量“年龄2”(1: 20岁;2:20~40岁;3:40~60岁;4:60岁),文化程度(1:文盲;2:小学; 3:初中;4:高中;5:中专;6:大专;7:本科;8:硕士研究生;9:博士研究生)化为哑变量“文化程度2”(1:中专或高中及以下;2:大专及以上)。
31.(1)Wald检验
Wald检验(Wald test)是对回归系数β的假设检验,通过估计β的标准误、再比较b与0的差别来进行,其检验统计量服从分布,计算式为:
(13-1)
(β的95%可信区间为:
b±1.96SE(β) (13-2)
OR的95%可信区间为:
eb±1.96SE(β) (13-3)
42). 似然比检验
用于比较两个模型的拟合效果。检验统计量为:G=-2lnL-(-2lnL’)。其中L是模型1的似然函数,L’是模型2的似然函数。模型1含有较少自变量,模型2不仅含有模型1的自变量,该统计量也服从分布该统计量服从。原假设为模型1和模型2拟合效果无改变;备择假设为模型1和模型2拟合效果有改变。似然比检验既适合单个自变量的假设检验又适合多个自变量的同时检验。
(Logistic回归模型的估计一般采用的是最大似然法,即使模型的似然函数G达到最大值。似然比检验(likelihood ratio test)是通过比较两个互相嵌套模型的对数似然函数统计量G,-2lnL被称为Deviance,简称D。似然比检验统计量为:
G=Dp-Dk
=-2×(模型p的对数似然函数-模型k的对数似然函数)
≈ (13-4)53). 比分检验
比分检验(score test)是以未包含某一个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。当
文档评论(0)