多元统计分析方法多元统计分方法析方法.ppt

多元统计分析方法多元统计分方法析方法.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计分析方法多元统计分方法多元统计分析方法多元统计分析方法

多元统计分析方法 The Methods of Multivariate Statistical Analysis 在医学研究中,常常用追踪(follow up)的 方式来研究事物发展的规律。例如: 了解某药物的疗效 了解手术后的存活时间 了解某医疗仪器设备的使用寿命 这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。 二、生存分析的基本概念 生存时间 生存时间数据的类型 生存时间数据的特点 生存分析资料的收集方法 描述生存时间分布规律的函数 生存分析的主要研究内容 B) 生存时间数据的类型 完全数据(complete data):它准确地度量了观察对象实际生存的时间。 截尾数据(censored data):它没有准确地度量观察对象实际生存的时间。例如, 在随访过程中某些观察对象失访; 或死于其它原因; 或在规定的研究过程结束时观察对象的终止事件还未发生。 C) 生存时间数据的特点: 1)所有观察值取值非负 2)存在截尾数据 生存分析资料的收集方法: 1)确定随访内容(指标变量) 2)确定随访人数(样本数) 3)确定随访的起始和终止时间 同时开始,同时结束 不同时间开始,同时结束 不同时间开始,不同时间结束 生存函数S(t):观察对象的生存时间T大于某时刻 t 的概率称为生存函数(survival function)。S(t)满足条件:S(0)=1, S(∞)=0,且0≤S(t)≤1。 1、描述法:根据样本观察值提供的信息,直接用公式计算出每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式来显示生存时间的分布规律。 优点:方法简单,且对数据的分布无要求。 缺点: 1) 不能比较两组或多组生存时间分布函数的区别; 2) 不能分析危险因素对生存时间的影响; 3) 不能建立生存时间与危险因素之间的关系模型。 2、非参数法:估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。例如,乘积极限法和寿命表法。 优点: 1) 可以估计生存函数; 2) 可以比较两组或多组生存布函数; 3) 可以分析危险因素对生存时间的影响; 4) 对生存时间的分布没有要求。 缺点:不能建立生存时间与危险因素之间依存关系的数学模型。 Cox比例风险回归模型 (1)数学模型:设x=(x1,x2,…,xk)是影响生存时间t 的k个危险因素。设h(t , x)表示受危险因素x的影响下,在时刻t 的风险率,又设 h0(t) 表示在不受危险因素 x 的影响下,在时刻 t 的风险率。显然 h0(t)=h (t ,0),并称 h0(t)为基准风险率或基准函数。 Cox比例风险回归模型是: 因为对于任意一时刻 t ,都有: 所以,个体在任何时刻的风险率都正比于基准风险率,比例因子为: (2)Cox比例风险模型参数和模型的检验 参数的估计方法---最大似然法 参数的显著性检验方法:似然比检验法,Wald 检验法和比分检验法等。 H0: βj=0 vs H1: βj≠0 3. 模型的显著性检验:似然比卡方检验法 H0: β1=…= β k=0 vs H1: βj≠0 (3)Cox比例风险模型参数的解释 对于一元Cox模型,如果因素 x 的取值为1和0,分别表示暴露与非暴露于危险因素之下,那么 例3:为研究某种药物是否会改进急性白血病人的预后,延长其缓解时间。将确诊病人随机给予不同的治疗。一组为用药组(传统治疗加某药),另一组为对照组(传统治疗)。治疗前检测病人白细胞计数(wbc),经一定时间随访,白血病病人的缓解时间列在下表中,其中带-号的是截尾数据。试作Cox模型回归分析。 本例以缓解时间长短来衡量治疗效果。缓解时间越长,效果越好。这里的缓解时间是生存分析中的生存时间t,其起点是接受某治疗开始,其终点是缓解结束。 令treat=1表示治疗组,treat=0表示对照组;wbc表示白细胞计数,是连续变量。为了减少内部变异的影响,将白细胞计数取自然对数。 不同疗法(treat)和白细胞数(lgwbc)均对病人的缓解时间产生影响。 从RR(treat)=0.260得知,采用新疗法的危险度仅是传统疗法的0.260倍(减少74%)。 从RR(lgwbc)=2.568得知,白细胞数增加,相对危险度上升,白血病人的生存时间缩短。 四、应用Cox 模型的注意事项 因素变量不能随时间变化而变化; 样本死亡相对数不能过小; 样本含量要足够大; 因素各水平组的例数要适当; 模型拟合要注意因素之间的交互作用; 分类型因素变量要建立哑变量; 生存曲线不能随意延长,也不能轻易用来作预报。 线性回归、lo

您可能关注的文档

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档