第二十章 logistic回归.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二十章 logistic回归.doc

第二十章 Logistic回归分析 教材:《卫生统计学 (6)》 方积乾主编 授课:中山医.公卫学院 骆福添 020luoft@mail.sysu.edu.cn 【说明】 ? 统计学门类: 业务统计,如政府统计、经济统计、工业统计、农业统计,等 科研统计,如数理统计、生物统计、医学统计、卫生统计 另类统计,如中统、军统、联邦调查局 ? 统计学教程:常包含两大方面内容 理论统计:模型公式、理论概念、严谨定义(ex:治愈80∕100,女性80∕100,两个80%是一样的) 应用统计:公式意义、应用条件、方法步骤、结果解释(ex:前者80%是频率,后者80%是比例) ? 这一章有理论推导和丰富的公式,建议自学;主要介绍应用“统计问题”(两三个公式) 【链接1】 统计分析的三大任务 1、描述样本数据的分布特征(数据?频数图表?平均数与变异度?95%范围) 2、估计总体指标置信区间(选定置信度,借误差分布规律反推) 3、检验总体指标之间差异(选定水准,据误差分布确定概率P) *三大法则:数据、分布、对比 -1.96S +1.96S 把握度(1-?)=0.95=中间面积 图a 参考范围 图b 置信区间(反推) -1.96 0 1.96 条件概率P=0.05 ? =尾部面积 图c 假设检验 【链接2】 简单相关与回归要点 图9.1 一年级女大学生体重与肺活量散点图2.0 图9.1 一年级女大学生体重与肺活量散点图 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 40 42 44 46 48 50 52 54 56 58 体重(kg) X 肺 活 量 (L) Y ? 平均水平=回归直线 ? 变异程度=相关系数(倒数) ? 2、估计: ? ρ=r ±1.96Sr ? β=b ±1.96Sb 3、检验: ? ? 【链接3】 复杂相关与回归(三大回归)要点 1、多重线性回归与相关:(多因素分析基础) 简单回归与相关的推广(自变量多了,描述-估计-检验类推) 2、Logistic回归:因变量Y=(0或1),自变量同多重回归(病因探索,尤其临床) 3、Cox回归:两个因变量Y =(t,d),自变量同多重回归(疗效分析,尤其慢病) 第一节 Logistic 回归模型 一、Logistic回归模型 例20-1 为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地6个镇35周岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。体质指数判为“超重或肥胖”, 为“正常”;收缩压≥140 和(或)舒张压≥90 判为“高血压”。整理后资料见表20-1。记样本患病率为,是相应总体概率的估计值;自变量为体质指数,赋值为1与0,表示“超重或肥胖”,表示“正常” ;因变量为是否患病,表示“患病”,表示“未患病”。 表20-1 不同体质指数组高血压患病率 体质指数() 调查人数 患病(=1) 未患病(=0) 患病率(%) 正常 (=0) 6792 1331 5461 19.60 超重或肥胖(=1) 4148 1656 2492 39.92 合计 10940 2987 7953 27.30 ? 因变量为二分类变量 ? 首先对进行数据变换: 这个变换将取值在0-1间的值转换为值域在(-)的值。 (20-1c) 变换式(20-1 c),得 (20-4) 若自变量扩展到个,(,,...,),则多变量回归模型为 (20-5e) 其中,为常数项(截距),、、...为回归系数。 二、模型参数的意义 类似线性回归,表示模型中所有自变量均为0时,的值;回归系数表示在控制其他自变量时,自变量变化一个单位所引起的改变量。我们有关于“优势”的表达式 例20-1中, “超重或肥胖”组()患高血压的优势为 一般地,根据多个自变量的回归模型,在其他变量取值不变的情形下,与变量的二个水平与()相对应的事件的优势比为 (20-6) 当的二个水平相差1个单位时,,=。 回归分析广泛用于流行病学中前瞻性的队列(???)研究、回顾性的病例-对照研究以及现况研究。 第二节 Logistic 回归的参数估计及假设检验 一、回归的参数估计 ? 极大似然估计( ,)最为常用。 ? 求解,使似

文档评论(0)

zzqky + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档