- 1、本文档共116页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7 相关与回归
第七章 相关与回归分析 相关分析 一元线性回归 多元线性回归 回归分析的其他问题 学习目标 掌握两个或多个变量之间相关关系的分析方法。 能够根据收集到的数据估计一元和多元回归方程,并对结果进行解释。 掌握回归分析模型的各类检验方法。 7.1 相关分析 函数关系与相关关系 相关分析与回归分析 散点图 相关系数 函数关系与相关关系 当一个变量取一定数值时,另一个变量有确定值与之相对应,这种关系称为函数关系。 当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化,这种关系称为相关关系。 对相关关系的分析是统计学的重要研究内容。 主要研究方法:相关分析和与回归分析。 相关分析与回归分析 相关分析(Correlation Analysis)研究变量之间相关的方向和相关的程度,但无法给出变量间相互关系的具体形式,因而无法从一个变量推测另一个变量。 相关分析的类型 根据相关关系的类型和程度可以有以下分类: 散点图 Scatter Diagram 散点图是观察两个变量之间的相关程度和类型最直观的方法。 散点图是在直角坐标系中用相对应的两个变量值作为图中一个点的横坐标和纵坐标描点得到的图形。 自变量和因变量 如果两个变量中一个变量是另一个变量变化的结果,那么 代表原因的变量称为自变量 [Independent (Explanatory) Variable], 代表结果的变量称为因变量 [Dependent (Response) Variable] 。 在散点图中习惯上把因变量绘制在纵轴上。 用散点图观察变量之间的相关关系 例题7.1 教材中的表7.1是 1985-2007年北京市城镇居民人均年消费性支出(变量Y)和人均年可支配收入(变量X)的有关资料,请对X和Y变量进行相关分析 。 散点图 相关系数的计算及其检验 相关系数的计算 相关系数r 的特征 当r>0时,X与Y为正相关;当r<0时,X与Y为负相关。 没有单位,取值介于-1与1之间。 绝对值越接近1说明关系越密切。r=1为完全正相关,而r=-1为完全负相关。 注意:当r=0时,只是表明两个变量之间不存在线性关系,它并不意味着X与Y之间不存在其他类型的相关关系。 相关系数的显著性检验 样本相关系数r受到抽样波动的影响,是一个随机变量。 相关系数非常高的样本也有可能来自无相关关系的总体。为了排除这种情况,需要对相关系数进行假设检验。 样本能代表总体吗? 如果红色的点碰巧为你的样本,则样本相关系数为0.907,总体相关系数为0.00005 相关系数的显著性检验 1、提出假设:H0:? ? ? ;H1: ? ? 0 消费支出和可支配收入的相关系数 计算结果: t检验值为 临界值t???(21)=2.08,故拒绝H0,认为相关系数显著。 注意:相关关系≠因果关系! 典型的错误推断: 统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。 7.2 一元线性回归分析 总体回归函数 、样本回归函数 一元线性回归模型的估计 一元线性回归模型的检验 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。 Regression 的原始释义 回归模型的类型 总体回归函数 样本回归函数 总体回归直线与样本回归直线 样本回归函数与总体回归函数区别 1、总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。 2、总体回归函数中的β1和β2是未知的参数,表现为常数。而样本回归函数中的 是随机变量,其具体数值随所抽取的样本观测值不同而变动。 样本回归函数与总体回归函数区别 3、总体回归函数中的et是Yt与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的et是Yt与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et的具体数值。 一元线性回归模型的统计假设 7.2.2 一元线性回归模型的估计 总体回归直线
您可能关注的文档
- 301倍力口服液讲课稿.ppt
- 39天津大学39.doc
- 39.第三十九章 广谱抗生素.ppt
- 3A高校录取情况.xls
- 3D地画艺术家--齐兴华.ppt
- 3、北京工业大学星火基金项目申报书(2012版).doc
- 3拟合优度检验.ppt
- 3微机和外设的数据传输.ppt
- 4 脉冲数字电路(南京航空航天大学机械考研初试必备).ppt
- 4- message authentication and hash.ppt
- 2025年辽宁沈阳辽中区四家事业单位面向区内事业单位遴选18人笔试模拟试题及参考答案详解1套.docx
- 2025年辽宁沈阳辽中区四家事业单位面向区内事业单位遴选18人笔试模拟试题及参考答案详解.docx
- 2025年辽宁沈阳辽中区四家事业单位面向区内事业单位遴选18人笔试模拟试题参考答案详解.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题含答案详解.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题带答案详解.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题及答案详解一套.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题附答案详解.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题及完整答案详解1套.docx
- 2025年辽宁沈阳理工大学招聘高层次人才142人笔试模拟试题及参考答案详解1套.docx
- 2025年辽宁沈阳法库县事业单位招聘博士15人笔试模拟试题带答案详解.docx
文档评论(0)