- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相关与回归分析弗朗西斯﹒
第十章 相关与回归分析 弗朗西斯﹒高尔顿先生被誉为现代相关和回归的创始人 1875年,他利用豌豆试验来确定尺寸的遗传规律。他挑选7组不同尺寸的豌豆,说服他的朋友每一组种植10粒种子,最后把原始的豌豆种子与新长的豌豆种子进行尺寸比较 当结果被绘制出来之后,他发现并非每一个子代都与父代一样,相同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代 高尔顿将此方法用到人类身上,他将父母和孩子的身高转换成z值,对比父母的身高与他们孩子的身高。他并发现孩子们的z值偏离均值的程度小于父母的偏离程度,即非常矮小的父母倾向于有偏高的孩子;而非常高大的父母则倾向于有偏矮的孩子。它把这叫做对均值的“回归”,这一发现构成了回归分析的基础 第一节 相关与回归概述 一、变量间的关系及分类 统计变量之间的关系,存在着两种不同的类型,一种是函数关系,另一种是相关关系 函数关系是指变量之间存在着的一种固定的、严格的数量依存关系,即一个变量数值的变动,都会有另一个变量的数值与之完全对应 相关关系是指变量之间存在着的一种非确定性的数量依存关系,即一个变量发生数值变化时,另一变量也相应地发生数值变化,但其数值是不固定的 二、相关分析的主要内容 相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法 其主要内容包括: 1.确定现象之间是否存在相关关系,以及相关关系呈现的形态 2、确定相关关系的密切程度 3.相关系数的检验 三、回归分析的主要内容 回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法 主要内容包括: 1.进行参数估计。即如何根据样本数据对回归模型的参数进行估计,求出具体的回归方程 2.进行显著性检验。即对回归方程、参数估计值进行显著性检验与校正,以便使回归方程或参数更加优良 3.进行预测和控制 五、回归分析的分类 在对回归分析进行分类时,主要有两种分类方式 第一,根据变量的数目,可以分类一元回归、多元回归 第二,根据自变量与因变量的表现形式,分为线性与非线性 所以,回归分析包括四个方向:一元线性回归分析、多元线性回归分析、一元非线性回归分析、多元非线性回归分析 我们把一元非线性回归分析和多元非线性回归分析合并为曲线回归分析 第二节 相关分析 一、相关关系的分类 1.按相关关系涉及因素的多少 单相关与复相关 2.按相关关系的表现形式 线性相关和非线性相关 3.按相关的方向 正相关和负相关 4.按相关程度来分 完全相关、不完全相关和不相关(完全不相关) 二、相关关系的度量 在进行相关分析时,可以通过相关表、散点图、计算相关系数等方法对相关关系进行度量 三、相关系数 相关表与散点图只能粗略的反映变量间相关关系的方向、形式和密切程度,要确切地反映相关关系的密切程度,还需计算相关系数 相关系数有很多种形式,常用由卡尔.皮尔逊提出的相关系数 1.相关系数的计算 相关系数用来度量的两个变量,设为x与y 根据总体数据计算的两个变量之间线性相关强度的统计量,叫做总体相关系数 根据样本计算的两个变量之间线性相关强度的统计量,叫做样本相关系数,简称相关系数,用r表示 相关系数r的测定方法有两种,第一种称积差法,第二种称简捷法 【例10-1】根据抽样知,某企业销售额与流通费用的相关情况,如表10-1,根据积差法与简捷法分别计算相关系数r。 2.相关系数的性质 第一、相关系数介于-1到+1之间 第二、r具有对称性,x与y的相关系数和y与x的相关系数相等 第三、r的数值大小与x和y的原点及尺度无关 四、相关系数显著性检验 相关系数是根据样本数据计算出来的,两个不相关的变量,其样本相关系数也可能较高 要从样本相关系数判断总体是否也具有这样的关系,需要对相关系数进行假设检验 【例10-2】某银行25个月的不良贷款与贷款余额之间的相关系数r为0.8436,在0.05的显著性水平下,检验不良贷款与贷款余额之间的相关系数是否显著 第三节 一元线性回归分析 一、一元线性回归模型 1.回归模型的一般形式 对于具有线性关系的两个变量,可以用一个方程来表示它们之间的线性关系 描述因变量y如何依赖于自变量x和误差项ε的方程称为回归模型。对于只涉及一个自变量的一元线性回归模型可表示为 3.回归方程 描述因变量y的期望值如何依赖于自变量x的方程称为回归方程。根据对一元线性回归模型的假设,可以得到它的回归方程为 4.估计的回归方程 如果回归方程中的参数已知,对于一个给定的x值,利用回归方程就能计算出y的期望值 用样本统计量代替回归方程中的未知参数 ,就得到估计的回归方程,简称回归直线 二、参数估计与预测 1.参数的最小二乘法估计 对于回归直线,关键在于求解参数 常用高斯提出的最小二乘法,也叫做最小平方法,它是使因变量的观察值y与估计值之间的离差平
文档评论(0)