网站大量收购闲置独家精品文档,联系QQ:2885784924

第15-17章 多因素分析(统计学).pptVIP

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 多因素分析 温州医学院环境与公共卫生学院 叶晓蕾 2 概念 多因素分析是同时对观察对象的两个或两个以上的变量进行分析。 常用的统计分析方法有: 多元线性回归、Logistic回归、COX比例风险回归模型、因子分析、主成分分析,等。 3 多变量资料数据格式 例号 X1 X2 … Xp Y 1 X11 X12 … X1p Y1 2 X21 X22 … X2p Y2 ┆ ┆ ┆ … ┆ ┆ n Xn1 Xn2 … Xnp Yn Y为定量变量——Linear Regression Y为二项分类变量——Binary Logistic Regression Y为多项分类变量——Multinomial Logistic Regression Y为有序分类变量——Ordinal Logistic Regression Y为生存时间与生存结局——Cox Regression 4 Y,X——直线回归 Y,X1,X2,…Xm——多元回归(多重回归) 第十五章 多元线性回归 (multiple linear regressoin) P.261 例:欲研究血压受年龄、性别、体重、性格、职业(体力劳动或脑力劳动)、饮食、吸烟、血脂水平等因素的影响。 5 β0为回归方程的常数项(constant),表示各自变量均为0时y的平均值; m为自变量的个数; β1、β2、βm为偏回归系数(Partial regression coefficient) 意义:如β1 表示在X2、X3 …… Xm固定条件下,X1 每增减一个单位对Y 的效应(Y 增减β个单位)。 e为去除m个自变量对Y影响后的随机误差,称残差(residual)。 多元回归方程的一般形式 一、多元回归模型 6 为y的估计值或预测值(predicted value); b0为回归方程的常数项(constant),表示各自变量均为0时y的估计值; 由样本估计而得的多元回归方程: b1、b2、bm为偏回归系数(Partial regression coefficient) 意义:如 b1 表示在X2、X3 …… Xm固定条件下,X1 每增减一个单位对Y 的效应(Y 增减 b 个单位)。 7 适用条件: 线性(linear)、独立性(independent)、正态性(normal)、等方差(equal variance)——“LINE”。 线性——自变量与应变量的关系是线性的。用散点图判断。 独立性——任意两个观察值互相独立。常利用专业知识判断。 正态性——就自变量的任何一个线性组合,应变量y均服从正态分布。即要求残差服从正态分布。常用残差图分析。 等方差——就自变量的任何一个线性组合,应变量y的方差均相同。即要求残差的方差齐性。用散点图或残差图判断。 8 9 (1)因素筛选:(因素分析) 例如影响高血压的诸多因素中: 1)哪些是主要因素? 2)各因素的作用大小? (2)提高回归方程的估计精度 多元回归比只有一个自变量的简单直线回归更能缩小应变量Y对其估计值的离差,在预测和统计控制方面应用的效果更好。 (3)控制混杂因素 多元线性回归除具有直线回归的基本性质外,还具有以下特点(用途): 10 (1)用各变量的数据建立回归方程 (2)对总的方程进行假设检验 (3)当总的方程有显著性意义时,应对每个自变量的偏回归系数再进行假设检验,若某个自变量的偏回归系数无显著性,则应把该变量剔除,重新建立不包含该变量的多元回归方程。 二、多元回归分析步骤 对新建立的多元回归方程及偏回归系数按上述程序进行检验,直到余下的偏回归系数都具有统计意义为止。最后得到最优方程。 11 例15-1(P.262) 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。 表15-2 27名糖尿病人的血糖及有关变量的测量结果 序号i 总胆固醇 甘油三脂 胰岛素 糖化血 血 糖 (mmol/L) (mmol/L) (μU/ml) 红蛋白(%) (mmol/L) X1 X2 X3 X4 Y 1 5.68 1.90 4.53 8.2 11.2 2 3.79 1.64 7.32 6.9 8.8 3 6.02 3.56 6.95 10.8 12.3 … … … … … … 26 5.84 0.92 8.61 6.4 13.3 27 3.84 1.20 6.45 9.6 10.4 12 由上表得到如下多元线性回归方程: 1、建立回归方程 13 2、回归方程的假设检验——F检验 结果

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档