- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Logistic 回归模型 赵耐青 复旦大学公共卫生学院 数据分析的背景 计量资料单因素统计分析 对于两组计量资料的比较,一般采用t检验或秩和检验。 对于两个变量的相关分析采用Pearson相关分析或Spearman相关分析 考虑多因素的影响,对于应变量(反应变量)为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。 数据分析的背景 单因素的分类资料统计分析,一般采用Pearson ?2进行统计检验,用Odds Ratio及其95%可信区间评价关联程度。 考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型P=a+bx就不合适了,应选用Logistic回归模型进行统计分析。 Logistic回归模型 按研究设计分类 非配对设计:非条件Logistic回归模型 配对的病例对照:条件Logistic回归模型 按反应变量分类 二分类Logistic回归模型(常用) 多分类无序Logistic回归模型 多分类有序Logistic回归模型 基础知识 通过下例引入和复习相关概念 例如:研究患某疾病与饮酒的关联性 患病率 P1=a/m1 P2=b/m2 基础知识 Odds(优势) 基础知识 P与Odds一一对应 对于两个Odds的比较,一般用它们的Ratio,并称为Odds Ratio(OR),其定义如下: 其样本估计统计量为 基础知识 故比较两个率== 比较OR =1? OR1 ? OR1? (二分类)Logistic回归模型 因为0Odds+? 所以 -? ln(Odds) +? 对ln(Odds)引入类似多重线性回归的表达式 Logistic回归模型 记: 故可以写为 也可以写为 回归系数的意义 以x1的回归系数?1为例 固定其它自变量,比较x1与x1 +1的ln(Odds)变化。 对于x1, 对于x1 +1, 反对数变换得到 实例1 实例1 饮酒的患病率和Odds分别为 实例1的Logistic回归模型 患病(Y=1)的概率为 x=1 表示饮酒,x=0表示不饮酒 回归系数?0,?1是未知参数,通常用最大似然估计的方法。 实例1:患病与未患病的概率 饮酒(x=1),患病概率和未患病概率分别 为 不饮酒(x=0),患病概率和未患病概率分别为 实例1:最大似然估计 本例的似然函数 选择?0和?1使似然函数L达到最大,即最大似然估计。 实例1:用Logistic模型进行统计分析 以上述实例资料用Stata统计软件对回归系数进行最大似然估计,得到回归系数估计为 即: Logistic模型的单个回归系数检验 关键是如果?=0,意味自变量X与Y无关联性。由于?的估计存在抽样误差,即使?=0,其估计值b一般不为0,故需检验?=0? H0: ?=0 H1: ??0 ?=0.05 检验统计量 可以证明: H0:?=0 为真时,z近似服从标准正态分布,即:|z|1.96,P0.05,拒绝H0 实例1:用Logistic模型进行统计分析 实例1的回归系数估计为 se(b)=0.1780719, z=b/se=2.31 ,P=0.0210.05 拒绝H0,差异有统计学意义,可认为??0。 饮酒与患AMI的关联性为 OR的95%可信区间为(1.06,2.14) 应用Logistic模型校正混杂作用 实例2:上例没有考虑吸烟情况,故将吸烟作为分层加入,资料如下: 实例2:应用Logistic模型校正混杂作用 从分层的资料表述可知:由于吸烟的混杂作用以致饮酒与AMI患病伴随有关联。 用x1=1和0分别表示饮酒和不饮酒,用x2=1和0分别表示吸烟和不吸烟,Logistic模型表示如下 Logistic模型的似然比检验 在多个自变量回归模型中,回归系数检验分为单个回归系数检验和多个回归系数检验。 单个回归系数检验表示其它变量均在模型中的情况下,检验某个回归系数?i=0,一般用Wald检验(如实例1)。 多个回归系数检验要用似然比方法(likelihood ratio test) Logistic模型的似然比检验 多个回归系数的检验(以实例2为例) H0:?1=?2=0 H1:?1,?2不全为0 ?=0.05 H0为真时,模型为 用最大似然法进行估计,其对数最大似然函数值(似然函数的最大值取对数)记为ln(L0) Logistic模型的似然比检验 H1为真时,实例2的模型为 用最大似然法进行估计,其对数最大似然函数值记为ln(L1) 记似然比检验统计量为2ln(L)=
您可能关注的文档
- EEC英语三年级I’mhungry课件.ppt
- EDA课后习题.ppt
- EI数据库的使用.ppt
- ESPRESSO韩国衣索.ppt
- Eva新二Lesson4Anexcitingtrip.ppt
- Excel-排序和筛选.ppt
- Excel在数学建模中的应用2013.ppt
- FAB利益销售.ppt
- Exelc培训大纲.ppt
- Feeder的使用及选择.ppt
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- ZZ027 全国职业院校技能大赛(中职组) 婴幼儿保育赛项理论题第3套(含答案).doc VIP
- 单片机(李朝青)课后习题答案.pdf
- ZZ027-全国职业院校技能大赛(中职组)-婴幼儿保育赛项第5套(含答案).doc VIP
- 厦门房地产行业报告.pptx VIP
- 普外科手术并发症处理ppt.pptx
- 劳淋(再发性尿路感染)中医临床路径.doc VIP
- 年处理10万吨乙醇-水筛板精馏塔设计说明书2024.12.18.docx
- 2023年2022版数学课程标准复习题.pdf VIP
- 土地利用现状调查方法技术.pdf
- 2022年人教版中考生物复习知识点思维导图 主题五 动物的运动和行为.ppt VIP
文档评论(0)