多因素分析 医学统计学.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
32 六、应用多元线性回归分析时需注意的事项 ( 1 )样本量要求: 无精确的计算公式。据经验, 样本量应是自变量数的 5~10 倍以上。 (20?) ( 2 )做预报时,只能在自变量 X 的观察值范围内 进行; ( 3 )在资料要求上,应变量 Y 服从正态分布; ( 4 )注意资料的特异点( outlier ); 33 ( 5 )观测值重新量化问题 ? 二项分类资料:用 X 表示分类变量,阴性为 0 ,阳性为 1 。 ? 有序多项分类资料:用一个 X 作为分类变量,以自然数 0 , 1 , 2 , … 赋值。如将病情分为轻中重三类时,用 X 表示病 情,赋值方法为: ? 无序多项分类资料: ? ? ? ? ? ? 2 1 0 重型病人 中度型病人 轻型病人 X ? ? ? ? ? ? 3 2 1 重型病人 中度型病人 轻型病人 X 或 34 表 无序多项分类的伪变量赋值方法 职 业 指示 变量 工人 农民 干部 职员 X 1 X 2 1 0 0 1 0 0 X 3 0 0 1 0 0 0 ? ? ? ? ? ? ? ? ? ? ? ? 0 1 0 1 0 1 3 2 1 其它 干部 其它 农民 其它 工人 X X X 上述以职员作为对比水平 ( 基础水平 ) 。哑变量 X 1 、 X 2 、 X 3 分别代表了工人、农民、干部与职员相比的系数。 哑变量代表的是同一个变量的不同取值,在分析时应当同时进 入或移出方程。即使只有部分哑变量有统计学意义也是如此。 35 ( 7 )自变量的联合作用分析 若要考虑 X 3 、 X 4 对应变量 y 的联合作用,可设置一个新变 量 X 5 = X 3 X 4 。若 b 3 、 b 4 和 b 5 都有统计学意义,则说明 X 3 、 X 4 对 应变量既有单独作用,又有交互作用。 ( 6 )自变量筛选过程中引入和剔除变量时检验水准 的确定 1 )引入变量检验的水准 小于 或 等于 剔除变量时检验的水准 2 )通常引入变量检验的水准为 0.05 ,剔除变量时 0.10 ,但不 绝对。 36 说明 X 3 、 X 4 对应变量既有单独作用,又有交互作用。即说 明糖尿病人体内胰岛素对血糖的影响依赖于糖化血红蛋白 的含量。 Coef ficients a -.790 3.172 -.249 .806 .365 .133 .321 2.744 .012 1.227 .510 1.539 2.405 .025 1.510 .343 .941 4.401 .000 -.179 .059 -1.828 -3.022 .006 (Constant) 甘 油 三 脂 x2 胰 岛 素 x3 糖 化 血 红 蛋 白 x4 X3*X4 Model 1 B Std. Error Unstandardiz ed Coef ficients Beta Standardiz ed Coef ficients t Sig. Dependent Variable: 血 糖 y a. 37 ( 8 )自变量的共线性 当自变量之间存在较强的相关关系时,称之为共线性。 后果 —— 偏回归系数的估计值容易失真。 当多元回归的分析结果出现以下情况时可考虑是否存在自变 量共线性: 1 )在某个检验水准下,整个回归方程有统计学意义,但是 每个偏回归系数的检验均无统计学意义。 2 )偏回归系数的符号与医学专业知识不一致。 3 )参数估计的标准误变得很大,使 t 值变得很小, P 值很大。 38 判断方法: 利用自变量间的相关系数阵。 ( r > 0.9 ,共线性可能性大) 处理方法: 最简单、有效的方法是根据专业知识人为去 除在专业上比较次要的、或缺失值较多、测 量误差较大的共线性因子。 39 ( 9 )残差分析 —— 模型诊断 i i i Y Y e ? ? ? 通常以标准化残差( standardized residual) 为纵 坐标,以 为横坐标,作残差图。 i Y ? 40 41 A B C D E F 残差呈随机分布 残差不满足方差 齐性条件 存在非线性关系 有异常点 42 第十六章 Logistic 回归 一、概念 Logistic 回归是一种适用于应变量为分类 值多因素概率型曲线模型。 Y 为二项分类: 非条件 Logistic 回归 —— 成组设计 条件 Logistic 回归 —— 配对设计 Y 为多分类:多分类 Logistic 回归 P.278

文档评论(0)

wq1987 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档