第九章 高级统计方法概论.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 高级统计方法概论

第九章 高级统计方法概论 ;本章内容;第一节?? 多重线性回归;二、应用条件;;?四、自变量筛选 ;自变量的筛选;编号; Variables Entered/Removed(a) ;Model Summary(f) ;ANOVA ;Coefficients(a) ;六、多重线性回归的应用;七、多重线性回归应用的注意事项;5、多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值变得很小。 (2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。;6 、残差分析 ;回归分析的步骤;第二节 logistic回归分析;传统上常使用Mantel-Haenszel分层分析方法,但该方法主要适用于样本含量大、分析因素较少的情况。;一、logistic回归模型;2、logistic回归模型的线性形式 ;3、logistic回归模型参数的意义 ;P1(y=1/x=1)的概率; 反映了在其他变量固定后,X=1与X=0相比发生Y事件的对数优势比。 回归系数β与OR X与Y的关联 β=0,OR=1 无关 β>0,OR>1 有关,危险因素 β<0,OR<1 有关,保护因子 ;二、logistic回归模型的参数估计 最大似然估计-需借助统计软件完成;三、Logistic 回归模型的假设检验; 2.检验二:检验模型中某β是否对Y有作用。 ;四、Logistic回归对变量做筛选;例:冠心病的8个可能危险因素与赋值 ;冠心病危险因素的病例?对照调查资料 ;例: 逐步筛选进入方程的自变量及参数估计; logistic回归的应用及注意事项 ; 二、logistic回归的注意事项 1.变量的取值形式 定量资料最好转化为分类变量资料,以便于解释 分类变量仍采用哑变量的赋值方法 应变量的编码相反,回归系数仅正负号变化 2.样本含量 原则:自变量个数越多,例数越多。各组样本例数(对照组和病例组)至少为自变量个数的5-20倍。 ;生存分析(survival analysis)是将事件的结果(终点事件)和出现这??结果所经历的时间结合起来分析的一种统计分析方法。 生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。;第一节 生存分析基本概念;生存时间举例; 终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。;生存时间的类型;大肠癌患者的随访记录 编号 性别 年龄 … 手术日期 随访终止日期 随访结局 生存时间(天) 1 男 45 …1991.05.20 1995.06.04 死亡 1476 2 男 50 …1992.01.12 1998.08.25 死亡 2417 3 女 36 …1991.10.24 1994.03.18 失访 876+ 4 男 52 …1994.11.02 2000.12.30 存活 2250+ 5 女 56 …1994.06.25 1995.03.17 死亡 265 6 女 60 …1993.12.05 1996.08.16 死于其它 985+ … ;生存时间; 二、条件生存概率、生存率、生存曲线;生存率: (survival rate, survival function ) 指观察对象经历t个单位时段后仍存活的 可能性。 ; 生存率与条件生存概率不同。条件生存率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulative probability of survival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。;生存曲线(survival curve) 以观察(随访)时间为横轴,以生存率 为纵轴,将各个时间点所对应的生存率 连接在一起的曲线图。 生存曲线是一条下降的曲线,分析时 应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档