- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9 章 相关分析与回归分析 刘廷兰 本章学习目的 通过本章的学习要求理解相关分析和回归分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能结合实际资料对变量进行相关和回归分析。 本章教学内容 相关关系的种类(四种) 相关分析与回归分析 相关分析(Correlation Analysis)研究变量之间相关的方向和相关的程度,但无法给出变量间相互关系的具体形式,因而无法从一个变量推测另一个变量。 自变量和因变量 如果两个变量中一个变量是另一个变量变化的结果,那么 代表原因的变量称为自变量 [Independent (Explanatory) Variable], 代表结果的变量称为因变量 [Dependent (Response) Variable] 。 在散点图中习惯上把因变量绘制在纵轴上。 调查50个房地产公司,房屋销售面积与广告费用之间的相关系数为0.76,这说明( ) A.二者之间有较强的正相关关系 B.平均看来,销售面积的76%归因于其广告费用 C.如要多销售1万平方米的房屋,则要增加广告费用7600元 D.如果广告费用增加1万元,可以多销售7600平方米的房屋 样本能代表总体吗? 如果红色的点碰巧为你的样本,则样本相关系数为0.907,总体相关系数为0.00005 相关系数的显著性检验 1、提出假设:H0:? ? ? ;H1: ? ? 0 消费支出和可支配收入的相关系数23个家庭调查 计算结果: t检验值为 临界值t???(21)=2.08,故拒绝H0,认为相关系数显著。 注意:相关关系≠因果关系! 典型的错误推断: 统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。 9.2 一元线性回归分析 总体回归函数 、样本回归函数 一元线性回归模型的估计 一元线性回归模型的检验 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。 Regression 的原始释义 注意 我们不能把回归分析看作是在变量间建立一个因果关系的过程。回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结论,必须建立在理论分析的基础之上。 总体回归直线与样本回归直线 一元线性回归模型的统计假设 一元线性回归模型的估计 总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。 在总体参数未知的情况下,如何保证样本回归系数尽可能接近总体参数的真实值? 在回归分析中最常用的估计方法是最小二乘法。 的意义 最小二乘估计 最小二乘估计 解这个方程组可得: 直线的起点值(不变费用) 当产量每增加1000件时,单位成本平均降低1.82元/件。 一元线性回归方程的评价和检验 拟合优度 1、决定系数 2、估计标准误差 显著性检验 3、t检验 4、F检验 决定系数为: 决定系数的取值 R2的取值范围是[0,1]。 R2越接近于1,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。 在一元线性回归中,相关系数r的平方等于判定系数,符号与自变量x的系数一致。因此可以根据回归结果求出相关系数。 所有的回归程序都会给出R2的值. 本学期课程结束 下次课带上做好的第4、8、5与6、9章题库来上课 统计学期末考试 一、单选(每小题2分,共30分,15题) 二、名词(第小题3分,共15分,5题) 三、简答(每小题5分,共15分,3题) 五、计算题(每题10分,共40分,,4题,要求写出公式、算式) 在满足一系列假设条件的情况下,最小二乘估计量是方差最小线性无偏估计量。需要的基本假设条件包括: 1、 2、对于所有的x, 的方差 相等 3、 与X之间不相关 4、 之间不相关 5、 服从正态分布
文档评论(0)