第七章 相关分析和回归分析幻灯片.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 相关分析和回归分析 第一节 变量间的相关关系 第二节 简单回归分析 第三节 多元回归分析 第一节 变量间的相关关系 相关的概念 相关分析的内容 相关系数及其计算 相关系数的检验 一、变量相关的概念 相关关系的类型(课本第114页) 相关关系的图示 二、相关分析的内容 (1)判断现象之间有无相关关系 (2)判断相关关系的方向、表现形态和密切程度 相关表和相关图 将变量X与Y对应数据用统计表反映,形成相关表。 探讨变量x,y的相关关系时,常须先做出散点图(Scatter Diagram),以坐标系上的点代表x,y的观察值,可以直观地考察变量之间联系程度,并且有助于选择合适的估计模型。 相关表 相关图(见前“相关关系的图示”) 图:Click宝珠笔的地区调查散点图 三、相关系数及其计算 相关系数的演变公式 相关系数取值及其意义 1、r 的取值范围是 [-1,1] 2、|r|=1,为完全相关 r =1,为完全正相关;r =-1,为完全负正相关 3、 r = 0,不存在线性相关关系相关 4、-1?r0,为负相关; 0r?1,为正相关 5、|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 1、双胞胎身高间的相关系数是r= 0.95 2、美国25—34岁男子收入与受教育程度r=0.34 美国55—64岁男子收入与受教育程度 r= 0.44 两点注意 1、r=0只表明不存在线性相关,而不能说明是否存在非线性相关(亦即: r=0 时可能存在曲线相关)。 2、 r值仅表明两变量相关程度,不表明因果关系。 相关系数算例 根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系数为 0.9987 等级相关系数 上面介绍的是简单相关系数,其次还有复相关系数,偏相关系数和等级相关系数等。(偏相关系数与复相关系数见课本第115页) 例:确定学校名气和毕业生表现业绩之间是否存在相关联? 四、相关系数的显著性检验 样本数据(r值)表明两个变量存在相关关系,是否能说明总体变量也存在相关关系? 相关系数的显著性检验 (实例) 对前例计算的相关系数进行显著性检(??0.05) 1、提出假设:H0:? ? ? ;H1: ? ? 0 2、计算检验的统计量 第二节 简单回归分析 回归分析的内容 回归模型和回归方程 简单线性回归(一元线性回归方 程)的建立(拟合) 线性回归方程拟合优度的测定 回归方程的显著性检验 回归预测 回归方法描述一个变量如何地依赖另一个变量。 身高和体重;成绩与努力程度;工作好坏与实力、机遇等 “回归”一词来源于生物学。英国生物统计学家高尔顿根据1078对父子身高的散点图发现,虽然身材高的父母比身材矮的父母倾向于有高的孩子,但平均而言,父母身材高的其子要矮些,而身材矮小的,其子要高些。这种遗传上身高趋于一般,“退化到平庸”的现象,高尔顿称作回归。 回归:借用的遗传学概念,现指变量之间的一般数量关系。 回归分析:用函数关系近似表达现象之间数量变化的一般规律。 反映现象间相关关系数量变化规律的函数表达式称为回归模型或方程。 回归分析与相关分析的区别(见课本113页) 1、相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量(dependent variable),处在被解释的地位,x 称为自变量(independent variable) ,用于预测因变量的变化 2、相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 3、相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 一、回归分析的内容 1、简单线性回归方程的拟合。从一组样本数据出发,确定变量之间的数学关系式 2、拟合优度的测定及回归方程的显著性检验。对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 3、回归预测。利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 二、回归模型和回归方程 回归模型 1、回答“变量之间是什么样的关系?” 2、方程中运用 1 个数字的因变量(响应变量) 被预测的变量 1 个或多个数字的或分类的自变量 (解释变量) 用于预测的变量 3、主要用于预测和估计 一元线性回归模型 (概念要点) 1、当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归 2、对于具有线性关系

文档评论(0)

love87421 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档