方差分析模型与线性回归模型入门演示文稿.ppt

方差分析模型与线性回归模型入门演示文稿.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 关于线性回归模型的高级话题 四、强影响点 强影响点的识别 图形分析法 做出散点图,观察有无离群值、强影响点 (残差图效能更高) 统计量/指标法 残差诊断指标:Statistic-Casewise diagnostics 距离指标 Mahalanobis:多个自变量出现大的马氏距离 Cook’s1; Leverage values2*P/N 专门的影响力统计量 DfBeta:去除该观察值后回归系数的变化值;Standardized ~ DfFit:表示去除该观察值后预测值的变化值;Standardized ~ Covariance ratio:协方差阵比率 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 关于线性回归模型的高级话题 强影响点的处理对策 人为错误:校正 去除– 补充进行个案分析 变量变换 非参数分析方法 稳健回归方法 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 关于线性回归模型的高级话题 五、多重共线性 多重共线性的表现 1.在某个检验水准α下,整个回归方程具有统计学意义,但各偏回归系数均无统计学意义; 2.偏回归系数的估计值明显地与实际情况不符,或者是偏回归系数的符号与专业知识中知道的情况相反,或者是,偏回归系数的绝对值大(或小)得不可信; 3.根据专业知识,该自变量与因变量间关系密切,而偏回归系数检验结果却无统计学意义; 4. 增加(或删除)一个自变量,或者改变(或去除)一个观察值,引起回归系数估计值发生较大的变化 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 关于线性回归模型的高级话题 导致回归系数的估计不稳定,计算的结果非总体回归系数的估计值 多重共线性的识别 相关系数阵; 容忍度0.1 方差膨胀因子(VIF):10,容忍度的倒数 特征根:多个维度特征根约为0 条件指数:30 多重共线性的处理对策 人为去除次要因子 逐步回归法:共线性较严重时不能解决共线性问题! 主成分回归和岭回归分析:有偏估计代替最小二乘估计 路径分析:同时分析直接(线性回归模型)和间接作用(a-b-Y) * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 模拟拟合的一般步骤 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 综合分析实例 某研究者希望根据三头肌皮褶厚度x1、大腿围x2和中臂围x3来预测身体的脂肪量Y,现随机抽取20名25~34岁的健康女性进行测量,请进行分析(jirou.sav)。 SPSS中的数据结构 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 三、Assignments 1. 模型中涉及的基本概念 2. 模型的基本原理 3. 统计建模的一般步骤 4. 模型应用条件检查的残差分析图 5. 线性回归模型中的多重共线性问题 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 SPSS SPSS 方差分析模型与线性回归模型入门 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 主要内容 一、方差分析模型入门 二、线性回归模型入门 三、Assignments * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 方差分析模型入门 基本概念 模型简介 模型的应用条件 分析实例 关于方差分析模型的高级话题 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 基本概念 1.因素(Factor) 与水平(Level) 因素:可能对应变量有影响的分类变量,如性别、血型; 水平: 因素的不同取值等级,即因素所处的一个状态,如性别有男、女两个水平; 2.单元(Cell)与元素(Element) 单元:因素各水平之间的每种组合,如研究性别(两水平)、血型(四水平)对成人身高的影响,该设计最多可有2*4=8个单元 在特殊的试验设计中,可能有的单元在样本中并不会出现(如拉丁方设计) 元素:指用于测量应变量值的观察单位,一个单元内可以有多个元素,也可以只有一个,甚至于没有元素。 元素不一定等同于受访者个体: 以家庭为单位收集资料 * 张志杰, 流行病学教研室, 公共卫生学院, 复旦大学 * 基本概念 3.均衡(Balance) 如果在一个实验设计中任一因素各水平在所有单元中出现的次数相同,且每个单元内的元素数目相同,则该试验是均衡的,否则,为不均衡的; 均衡实验设计的检验效能较高。 4.协变量(Covariate) 对应变量可能有影响,在分析时需加以控制的连续型变量; 实际上,可以简单的把因素和协变量分别理解为分类自变量和连续型自变量; 当模型中存在协变量时,一

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档