- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Logisti回归方程1汇编
Logistic Regression Analysis Logistic回归分析 陈新 Logistic回归分析 在医学研究中, 经常要分析某种结果的产生与哪些因素有关。 例如:生存与死亡, 发病与未发病, 阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。如何找出其中哪些因素对结果的产生有显著性影响呢? Logistic回归分析能较好地解决这类问题。 一、 Logistic回归模型 1、 Logistic回归模型的构造 若因变量y为连续型正态定量变量时, 可采用多元线性回归分析y与变量 X1, X2, … , Xp之间的关系: y=β0+β1X1+β2X2+…+βpXp 等式左边 变化范围 经数学变换可得: exp(β0+β1X1+…+βpXp) P= ───────────── 1+ exp(β0+β1X1+…+βpXp); exp表示指数函数。 Logistic回归模型是一种概率模型, 它是以疾病,死亡等结果发生的概率为因变量, 影响疾病发生的因素为自变量建立回归模型。 它特别适用于因变量为二项, 多项分类的资料。 在临床医学中多用于鉴别诊断, 评价治疗措施的好坏及分析与疾病预后有关的因素等。 CHISS软件要求,对分类变量Y数量化,而且赋值为: 1 发病 (阳性, 死亡 , 治愈等) y = 0未发病 (阴性, 生存, 未治愈等). 注意 :P=P(y=1), 即发病的概率。 logistic 回归系数的意义 OR=e β lnOR= β 实例分析 实例分析 5、参数检验 1.似然比检验(likehood ratio test) 通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为G G=-2(ln Lp-ln Lk) n较大时, G近似服从自由度为待检验因素个数的?2分布。 比分检验(score test) 以未包含某个或几个变量的模型计算保留模型中参数的估计值,并假设新增参数为零,计算似然函数的一价偏导数及信息距阵,两者相乘便得比分检验的统计量S 。n 较大时, S近似服从自由度为待检因素个数的?2分布。 Wald检验( wald test) 即广义的t检验,统计量为u u服从正态分布,即为标准正态离差。 以上三种方法中,似然比检验最可靠,比分检验一般与它相一致,但两者计算量均较大;而Wald检验未考虑各因素间的综合作用,在因素间有共线性存在时,结果不像其它两者可靠。 分析因素xi为等级变量时,如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时, e(bi) 表示xi增加一个等级时的优势比, e(k* bi)表示xi增加k个等级时的优势比。 分析因素xi为连续性变量时, e(bi)表示xi增加一个计量单位时的优势比。 6、 Logistic回归分析方法 分析思想与多重线性回归分析相同 筛选变量的方法: 前进法 后退法 逐步法 统计量不再是线性回归分析中的F统计 量,而是上面介绍的三种统计量之一。 为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。 7、哑变量的设置和引入 哑变量,又称指示变量 有利于检验等级变量各个等级间的变化是否相同。 一个k分类的分类变量,进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(dummy variable)来表示。这样指示变量都是二分变量,每一个指示变量均有一个回归系数,其解释同前。 哑变量的设置 二、条件Logistic回归 对配比调查资料,多采用条件Logistic回归分析。 假设自变量在各配比组对结果变量的作用相同,即自变量的回归系数与配比组无关。 配比设计的Logistic回归模型
文档评论(0)