-相命关与回归.pptVIP

  • 1
  • 0
  • 约8.53千字
  • 约 73页
  • 2019-01-08 发布于福建
  • 举报
-相命关与回归

7 相关分析 学习目标 掌握一元线性回归的基本原理和参数的最小二乘估计方法 掌握回归方程的显著性检验 利用回归方程进行预测 掌握相关系数的含义、计算方法和应用 7.1 概述 相关关系的含义 相关关系的分类 相关关系的内容 变量间的关系 (函数关系) 变量间的关系 (函数关系) 是一一对应的 确定关系 各观测点落在 一条线上 变量间的关系 (相关关系) 变量间的关系 (相关关系) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 7.1.2 相关关系种类 正相关与负相关 直线相关与曲线相关 单相关与复相关 相关关系的图示 7.1.3 相关分析与回归分析 7.1.4相关分析与回归分析 区别 在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。 相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。 相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。 7.1.5相关分析与回归分析 联系 相关分析是回归分析的基础和前提 回归分析是相关分析的深入和继续 7.2 一元线性回归 回归分析的特点 一元线性回归方程 估计标准误差 回归方程的显著性检验 利用回归方程进行预测与控制 对总体回归方程参数的估计 7.2.1 回归分析的特点 回归分析是应用统计方法寻找一数学方程,建立自变量与因变量之间的关系,并据以利用自变量的给定值来推算或估计因变量的值 因变量是随机变量,自变量是非随机变量,是给定的数值 线性回归与非线性回归 一元线性回归与多元线性回归 7.2.2 一元线性回归方程的建立 一元线性回归方程 最小二乘法确定回归方程系数 一元线性回归模型 (概念要点) 对于只涉及一个自变量的简单线性回归模型可表示为 模型中,Y 是X 的线性函数(部分)加上误差项 线性部分反映了由于X 的变化而引起的Y的变化 误差项 ? 是随机变量 反映了除 X 和 Y之间的线性关系之外的随机因素对 Y 的影响 是不能由 X 和 Y 之间的线性关系所解释的变异性 回归方程 总体回归方程 (概念要点) 简单线性回归方程的形式如下 E( Y ) = ?0+ ?1X 描述 Y 的平均值或期望值如何依赖于 X 的方程称为总体回归方程。 估计的回归方程 最小平方法 (图示) 最小平方法 (概念要点) 最小平方法确定回归方程系数 估计方程的求法 (实例) 【例7.1】根据表7-1中的数据,配合人均消费金额对人均国民收入的回归方程。 根据方程系数的求解公式得 估计(经验)方程 人均消费金额对人均国民收入的回归方程为 7.2.3 估计标准误差 估计标准误差含义 估计标准误差的计算 估计标准误差的含义 根据回归方程计算的因变量的值与实际观察值有一定的差距即估计标准误差,该误差的大小反映了回归直线的代表性,因此,拟合出回归线后,需要计算估计标准误差,以确定该回归线的可利用价值如何 估计标准误差的计算 离差平方和的分解 因变量 y 的取值是不同的,y 取值的这种波动称为变差 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值 之差来表示 全部n次观察值的总变差可由这些离差的平方和 表示 离差平方和的分解 (图示) 离差平方和的分解 (三个平方和的关系) 两端平方后求和有 离差平方和的分解 (三个平方和的意义) 总变差(Lyy) 反映因变量的 n 个观察值与其均值的总离差 回归变差(U) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 剩余变差(Q) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和 7.2.4 回归方程的显著性检验 回归方程显著性检验统计量 回归方程的显著性检验 (检验的步骤) 提出假设 H0: 7.2.5利用回归方程进行 预测与控制 利用回归方程进行预测与控制 小样本时预测值的区间估计 大样本时预测值的区间估计 利用回归方程进行预测 ? y0在1-?置信水平下的预测值为 利用回归方程进行预测 (置信区间估计:算例) 【例7.2】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间。 解:根据前

文档评论(0)

1亿VIP精品文档

相关文档