同济医学院SSS讲义SSSLogistic回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Logistic回归 第10章 非参数检验 内容 基本概念 基本步骤 基本操作 基本结果解释 数据分析的背景 计量资料单因素统计分析 对于两组计量资料的比较,一般采用t检验或秩和检验。 对于两个变量的相关分析采用Pearson相关分析或Spearman相关分析 考虑多因素的影响,对于应变量(反应变量)为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。 数据分析的背景 单因素的分类资料统计分析,一般采用Pearson ?2进行统计检验,用Odds Ratio及其95%可信区间评价关联程度。 考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型P=a+bx就不合适了,应选用Logistic回归模型进行统计分析。 Logistic回归模型 按研究设计分类 非配对设计:非条件Logistic回归模型 配对病例对照:条件Logistic回归模型 按反应变量分类 二分类Logistic回归模型(常用) 多分类无序Logistic回归模型 多分类有序Logistic回归模型 基础知识 通过下例引入和复习相关概念 例如:研究患某疾病与饮酒的关联性 患病率 P1=a/m1 P2=b/m2 基础知识 Odds(优势) 基础知识 P与Odds一一对应 对于两个Odds的比较,一般用它们的Ratio,并称为Odds Ratio(OR),其定义如下: 其样本估计统计量为 基础知识 故比较两个率== 比较OR =1? OR1 ? OR1? (二分类)Logistic回归模型 因为0Odds+? 所以 -? ln(Odds) +? 对ln(Odds)引入类似多重线性回归的表达式 Logistic回归模型 记: 故可以写为 也可以写为 回归系数的意义 以x1的回归系数?1为例 固定其它自变量,比较x1与x1 +1的ln(Odds)变化。 对于x1, 对于x1 +1, 反对数变换得到 回归系数的意义 多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。 存在因素间交互作用时, Logistic回归系数的解释变得更为复杂,应特别小心。 适用条件 反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。 logistic回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计。 例1 SPSS基本操作 SPSS基本操作 SPSS基本操作 SPSS基本操作 SPSS基本操作 哑变量设置 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。 如果对二项分类变量按+1与-1编码,那么结果容易造成错误的解释。 分类变量必须转化。如地区对血压的影响。 等级资料,当等级之间量度不一时必须转化,如正常,超重和肥胖 连续资料不宜直接进入方程时,转化为等级资料或分类资料 SPSS哑变量设置 Indicator Simple Difference Repeated SPSS哑变量设置 Helmert 与Difference相反,各水平与其之后水平的平均效应比较 Deviation: 除参照分类外,各水平与分类的总效应比较 Polynomial 正交多项式设置 自动设置哑变量是有缺点的 等级变量不合适 哑变量设置应注意的问题 参照水平最好要有实际意义,不推荐使用其他作为参照; 参照水平组要有一定的频数作保证,应不少于30或50例; 对有序自变量的分析: 从专业出发确定; 分别以哑变量和连续性变量的方式引入模型进行比较后确定。 SPSS基本操作 SPSS基本操作 校正混杂作用 实例2:上例没有考虑吸烟情况,故将吸烟作为分层加入,资料如下: SPSS基本操作 同例1 逐步回归分析 在多因素统计分析中,多个自变量之间存在相关性,往往相互影响,研究者希望寻找主要影响应变量Y的因素。 理论上,只要把各种因素组合都试一遍,寻找变量个数最多,每个变量均有统计学意义,并且模型拟合程度最好的模型,这种模型称为最佳预测模型,这种方法称为寻找最优子集,当变量较多时很难实现。 逐步回归 为了比较方便地找到最佳预测回归模型,一般采用逐步回归的分析策略建立拟最佳预测回归模型。 逐步回归采用逐个增加最佳变量的方式或逐个减少最差的变量方式找到最佳或拟最佳回归模型。 逐步Logistic回归 无论是条件还是非条件Logistic回归,在多变量分析时均可以采用逐步回归方法,实现的方法是: 所有变量一次全部进入方程。 向前法 后退法 逐步回归 前进法:

文档评论(0)

duoduoyun + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档