统计学课件-6 相关与回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学课件-6 相关与回归

凌洁 * 相关分析 回归分析 第六章 相关与回归 相关和回归分析方法,是分析两个或更多变量之间的相互关系,测定它们之间联系的紧密程度,以揭示其变化的具体形式和规律性,以便用一个或几个变量,去预测另一个我们感兴趣的变量。 主要内容 相关分析 概念 种类 线性相关 变量之间关系 函数关系 相关关系 因果关系 互为因果关系 共变关系 确定性依存关系 随机性依存关系 种类 一元相关 多元相关 负 相 关 正 相 关 线性相关 曲线相关 x y 正 相 关 x y 负 相 关 x y 曲线相关 x y 不 相 关 线性相关 相关系数 测定两变量是否线性相关? 定义式: 未分组: 已分组:见P201页 值: |r|=0 不存在线性关系; |r|=1 完全线性相关 0|r|1不同程度线性相关(0~0.3 微弱;0.3~0.5 低度; 0.5~0.8 显著;0.8~1 高度) 符号:r0 正相关;r0 负相关 计算公式 相关系数的检验(t检验) 检验统计量 回归分析 特 点 一元线性回归 多元线性回归 非线性回归 逻辑回归 种 类 特点 1·理论和方法具有一致性; 2·无相关就无回归, 相关程度越高,回归越好; 3·相关系数和回归系数 方向一致,可以互相推算。 1·相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量; 2·相关分析中x,y均为随机变量,回归分析中,只有y为随机变量; 3·相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 种类 一元回归 多元回归 线性回归 非线性回归 自变量的多少 变量之间的具体变动形式 一元线性回归 1·一元线性回归模型的一般形式 总体一元线性回归模型的一般形式 Y的数学期望E(Yi) 随机误差 也称一元线性回归方程,是对应于自变量X某一取值时因变量Y的均值。 未知参数 Yi=α+βXi+εi 回归系数b表明自变量x每变化一个单位因变量y的平均增(减)量。 b与r的关系: r>0 r<0 r=0 b>0 b<0 b=0 样本的一元线性回归模型和回归方程 一元线性回归模型: 一元线性回归方程: 截距 斜率(回归系数) x y 2·一元线性回归模型的确定 根据实际数据,用最小平方法,即使 ,分别对a、b求编导并令其为零,求得两个标准方程: 解联立方程,得到 3·一元线性回归模型拟合优度的评价 判定系数(r2) 是对回归模型拟合优度的评价。 x y 总离差 = 回归离差 + 剩余离差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。 r 的符号同 b 估计标准误(Syx) Syx 越小, 拟合越好; Syx 越大, 拟合越差。 Syx也是用自变量对因变量进行区间估计的抽样误差。 68.27% 94,45% 99.73% 是一个测量Y的实际值与Y的预测值之间离散程度的统计量。 4·回归分析中的假设条件和残差分析 回归分析中的假设条件 随机误差项ε的理论假定 值相互独立 服从正态分布 的数学期望E( )=0 的方差 都相同,且 残差分析 随机误差项ei = Yi -又称为残差,对残差进行分析,既能用来评价回归模型与实际数据的拟合优度,也能评价回归的假设能否成立。 评价回归模型的拟合优度 可通过绘制残差图直观地进行评价。 残差图是以残差为纵坐标、以相应自变量的X值为横坐标的散点图。 散点的分布不存在明显的变化规律 ,说明建立的模型对数据是合适的 。 散点的分布有明显的变化规律 ,说明建立的模型对数据是不合适的 。 假设条件的评估 (1)等方差性 :通过残差与Xi的残差图来评价 残差 0 X 0 此图中,散点如扇形般地展开,即显示出X增大时残差的变异也在增大,证明了在X的每个水平上,Y缺少等方差性 (2)正态性。可通过残差分析中计算残差的频数分布,并把其结果用直方图加以反映和评估。 引例店址选择的数据,可把残差列成如表的频数分布,并把其结果可用直方图展示出来 . 残差 频数 -300到-200 1 -200到-100 2 -100到0 4 0到100 4 100到200 4 合计 15 (3)独立性。可根据数据获得的先后顺序排列的残差散点图来评估。 在一段时间内收集的数据,有时观测值中会存在着自相关的影响。此时,前后之间的残差就会有某种联系。若存在这种联系,就违背了独立性假设,

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档