- 5
- 0
- 约 93页
- 2022-03-21 发布于湖南
- 举报
统计学,相关与回归分析,课程讲义,统计学教程
因变量离差用总的平方和SST表示,确定了估计的回归方程之后,SST就被分解为两部分:方程可以解释的部分为回归平方和SSR,方程未能解释的部分为残差平方和SSE。 第二节 简单线性回归 对因变量离差分解的图示: SST=SSR+SSE SST=SSR+SSE 通常,三个平方和不用离差的方式计算,而是使用下式: 第二节 简单线性回归 二、回归方程的拟合优度 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 判定系数(Coefficient of determination)是对估计的回归方程拟合优度的度量。 判定系数表明 y 的全部变异中能被估计的回归方程解释的部分所占比例,通常用 r2 表示。 第二节 简单线性回归 协方差有量纲即计量单位,从而影响了对相关程度的描述。 第一节 相关分析基础 注意:将体重单位改为克,皮尔逊相关系数仍为0.781。这就是皮尔逊相关系数的优势:不受计量单位的影响 皮尔逊相关系数计算举例:某快餐连锁店开在高校附近的10个分店营业额及学校学生规模资料如下: 第一节 相关分析基础 分店 A B C D E F G H I J 季营业额(万元) 58 105 88 118 117 137 157 169 149 202 学生规模(千人) 2 6 8 8 12 16 20 20 22 26 为避免计算离差,在原始数据基础上做如下加工: 第一节 相关分析基础 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 第一节 相关分析基础 分店 学生规模 x 季营业额 y x2 y2 xy A B C D E F G H I J 2 6 8 8 12 16 20 20 22 26 58 105 88 118 117 137 157 169 149 202 4 36 64 64 144 256 400 400 484 676 3364 11025 7744 13924 13689 18769 24649 28561 22201 40804 116 630 704 944 1404 2192 3140 3380 3278 5252 ? 140 1300 2528 184730 21040 关于皮尔逊相关系数 r 的说明: 第一,r 取值在-1与1之间,等于-1时为完全线性负相关,等于1时为完全线性正相关,等于0时为线性不相关。 注意: r等于0或接近0时,不代表两变量不相关(因为可能存在非线性相关关系)。 第一节 相关分析基础 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第二,通常将 r 的绝对值域划分为三段,0.3以下为弱相关;0.3至0.7为中等相关;0.7以上为强相关。 但要注意,仅当样本容量足够大时,才可以做这样的判断。 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第三,判断变量间线性相关程度和是否有意义,与样本容量有关。当样本容量较小时,较高的相关程度也可能没有意义。一个有用的判断法则是: 第一节 相关分析基础 样本容量 具有线性相关关系的 r 绝对值 2 ≥1.4142 4 ≥1 10 ≥0.6325 15 ≥0.5164 20 ≥0.4472 25 ≥0.4 30 ≥0.3651 第一节 相关分析基础 关于皮尔逊相关系数 r 的说明: 第四,极端值(离群点、高杠杆点)会影响相关系数。因此,要注意预先识别和处理极端值。 第一节 相关分析基础 关于皮尔逊相关系数 r 的检验 如前所述:样本显示两变量间存在线性关系,并不意味着总体也是如此。 因此,必须
您可能关注的文档
- 中国近代史纲要—中华民族的抗日战争.ppt
- 材料力学习题集.ppt
- 乳腺癌放射治疗靶区确定与勾画.ppt
- 软件工程学—面向对象方法学引论.ppt
- 中国近代史纲要—中国革命的新道路.ppt
- 概率论与数理统计.ppt
- 概率统计学—参数估计.ppt
- 概率统计学—二维随机变量及其分布.ppt
- 流体传动与控制—绪论.ppt
- 软件工程学—概述.ppt
- 河北盐山中学等校2025-2026学年上学期高三一模化学试卷(含解析).docx
- 河北正定中学2025-2026学年高一上学期期末考试物理试卷(含解析).docx
- 河北张家口市怀安县2025-2026学年第一学期期末教学综合评价八年级地理试卷(含解析).docx
- 河南安阳市殷都区2025-2026学年第一学期期末教学质量检测七年级地理试卷(含解析).docx
- 河南安阳市滑县2025一2026学年第一学期期末学业质量监测八年级地理试题(含解析).docx
- 河南安阳市林州市2025-2026学年上学期期末考试高一政治试题(含解析).docx
- 河南焦作市武陟县第一中学2025-2026学年高一上学期1月月考语文试卷(含解析).docx
- 河南济源市2025-2026学年上学期期末学业质量调研七年级历史试卷(含解析).docx
- PICC导管并发症的紧急处理与护理.pptx
- 河南鹤壁市2025-2026学年高二上学期期末考试生物试题(含解析).docx
最近下载
- 导数概念及其意义高二下学期数学人教A版(2019)选择性必修第二册.docx VIP
- 无负压供水设备安装施工方案.docx VIP
- 2026年苏州工业园区服务外包职业学院单招职业技能测试题库及参考答案详解.docx VIP
- 道班施工组织设计.doc VIP
- 2025年陕西省西安市碑林区铁一中中考七模物理试卷.doc VIP
- TB-T2075-2002《电气化铁道接触网零部件》.pdf VIP
- 索尼DSC-HX30使用说明书.pdf
- 2026年苏州工业园区服务外包职业学院单招职业技能考试题库有答案解析.docx VIP
- FIDIC白皮书中文版.docx
- 海南省国资委省属国有企业招聘笔试题库2025.pdf VIP
原创力文档

文档评论(0)