统计学—相关与回归分析.pptVIP

  • 5
  • 0
  • 约 93页
  • 2022-03-21 发布于湖南
  • 举报
统计学,相关与回归分析,课程讲义,统计学教程

因变量离差用总的平方和SST表示,确定了估计的回归方程之后,SST就被分解为两部分:方程可以解释的部分为回归平方和SSR,方程未能解释的部分为残差平方和SSE。 第二节 简单线性回归 对因变量离差分解的图示: SST=SSR+SSE SST=SSR+SSE 通常,三个平方和不用离差的方式计算,而是使用下式: 第二节 简单线性回归 二、回归方程的拟合优度 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 判定系数(Coefficient of determination)是对估计的回归方程拟合优度的度量。 判定系数表明 y 的全部变异中能被估计的回归方程解释的部分所占比例,通常用 r2 表示。 第二节 简单线性回归 协方差有量纲即计量单位,从而影响了对相关程度的描述。 第一节 相关分析基础 注意:将体重单位改为克,皮尔逊相关系数仍为0.781。这就是皮尔逊相关系数的优势:不受计量单位的影响 皮尔逊相关系数计算举例:某快餐连锁店开在高校附近的10个分店营业额及学校学生规模资料如下: 第一节 相关分析基础 分店 A B C D E F G H I J 季营业额(万元) 58 105 88 118 117 137 157 169 149 202 学生规模(千人) 2 6 8 8 12 16 20 20 22 26 为避免计算离差,在原始数据基础上做如下加工: 第一节 相关分析基础 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 第一节 相关分析基础 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 关于皮尔逊相关系数 r 的说明: 第一,r 取值在-1与1之间,等于-1时为完全线性负相关,等于1时为完全线性正相关,等于0时为线性不相关。 注意: r等于0或接近0时,不代表两变量不相关(因为可能存在非线性相关关系)。 第一节 相关分析基础 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第二,通常将 r 的绝对值域划分为三段,0.3以下为弱相关;0.3至0.7为中等相关;0.7以上为强相关。 但要注意,仅当样本容量足够大时,才可以做这样的判断。 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第三,判断变量间线性相关程度和是否有意义,与样本容量有关。当样本容量较小时,较高的相关程度也可能没有意义。一个有用的判断法则是: 第一节 相关分析基础 样本容量 具有线性相关关系的 r 绝对值 2 ≥1.4142 4 ≥1 10 ≥0.6325 15 ≥0.5164 20 ≥0.4472 25 ≥0.4 30 ≥0.3651 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第四,极端值(离群点、高杠杆点)会影响相关系数。因此,要注意预先识别和处理极端值。 第一节 相关分析基础 关于皮尔逊相关系数 r 的检验 如前所述:样本显示两变量间存在线性关系,并不意味着总体也是如此。 因此,必须

文档评论(0)

1亿VIP精品文档

相关文档