- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
同济医学院-《医学多元统计》课件-多元logistics回归分析
多元Logistics回归分析 内容 基本原理 数学模型 方法步骤 系数解释 条件Logistics分析 应用 内容 基本原理 数学模型 方法步骤 系数解释 条件Logistics分析 应用 从数学角度看,logistic回归模型非常巧妙地避开了分类型变量的分布问题,补充完善了线性回归模型和广义线性回归分析的缺陷。 因变量y 是分类型变量,自变量x是与之有关的一些因素。但是,这样的问题却不能直接用线性回归分析方法来解决,其根本原因就在于因变量是分类型变量,严重违背了线性回归分析对数据的假设条件。 从数学角度看,很难找到一个函数y=f (x),当x变化时,它对应的函数值y仅取两个或几个有限值。 研究者将所要研究的问题转换了一个角度,不是直接分析y与x的关系,而是分析y取某个值的概率p与x的关系。 分析因变量y取某个值的概率p与自变量x的关系,等价于寻找一个连续函数p=p(x),使得当x变化时,它对应的函数值p不超出[0,1]范围。数学上这样的函数是存在且不唯一的,logistic回归模型就是满足这种要求的函数之一。 根据数据的类型,logistic回归分析分为两种: 一种是条件logistic回归(conditional logistic regression),用于分析配对病例对照研究数据。 另一种是非条件logistic回归(unconditional logistic regression),用于分析成组数据或非配对的病例对照研究。 非条件logistic回归分析也简称为logistic回归分析。 内容 基本原理 数学模型 方法步骤 系数解释 条件Logistics分析 应用 多元 logistic回归模型 如果对模型的概率 p 进行logit 变换 logistic回归模型的另一种形式,它给出的是变量z=logit(p)关于x 的线性函数 多值变量的 logistic回归模型 p j = p( y≤ j | x ),它表示了 y 取前 j 个值的累积概率(cumulative probability)。 累积概率函数 第一个模型表示了y 取第一个值的概率p1与x的关系;第二个模型表示了y 取前两个值的累积概率p2与x的关系。这两个模型的常数项不同,回归系数完全相同的。 y 取第一个值的概率p(1)=p1 ,y 取第二个值的概率p(2)=p2 -p1,y 取第三个值的概率p(3)=1- p2 。它们的截距不同,斜率相同,所以是g-1条平行直线族。多值因变量logistic回归模型要求进行数据的平行性检验。 内容 基本原理 数学模型 方法步骤 - 参数估计 - 检验参数 - 模型检验 - 平行性检验 系数解释 条件Logistics分析 应用 参数估计 在logistic回归分析模型中,回归系数的估计方法通常是最大似然法(Maximum Likelihood method)。最大似然法就是选取使得总体真参数落在样本观察值领域里的概率达到最大的参数值作为真参数的估计值。 为了得到一个非偏估计(non-biased estimate),需采用重复递推的方法,将最大似然估计值不断修正。软件系统使用的是重复加权最小二乘递推法(iteratively reweighted least squares algorithm)来估计回归系数。 和线性回归分析一样,logistic回归模型的回归系数是自变量对应变量作用大小的一种度量。因为自变量的单位不同,不能用回归系数的估计值来判断哪一个自变量对因变量的影响作用最大。为了要进行比较,需要计算出标准回归系数。计算原理和线性回归分析一样。在标准回归系数估计值中,绝对值最大的标准回归系数对应的 x 变量对 y 变量的影响最大。 检验参数 统计假设常用的方法是Ward卡方检验。当大于样本对应的Ward卡方值的概率小于0.05时,在统计意义上可以拒绝上述零假设。即,可以认为第 j个 x 变量对y=1的概率p有显著性影响,其犯第一类错误的可能性不超过5% 。和线性回归分析一样,当自变量个数较多时,可采用逐步回归分析方法来筛选危险因子。 模型检验 logistic回归模型的总体检验常用的方法有: AIC检验法(Akaike Information Criterion)。用于比较同一数据下的不同模型(含自变量个数不同)。AIC值越小,模型越合适。AIC值的计算公式是: SC检验法(Schwarte Coriterion)。和AIC一样,用于比较同一数据下的不同模型(含自变量个数不同)。SC值越小,模型越合适。SC的计算公式是:
文档评论(0)