- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§6.1 概述 一、“回归”最初的涵义 遗传学中的名词,英国生物学家兼统计学家高尔登首先提出来的。 回归现代涵义 研究自变量与因变量之间的关系形式的分析方法。 目的:根据已知自变量来估计和预测因变量的值。 例如: 二、回归分析和相关分析 1、相关关系的概念 客观事物之间的相关关系的概念: 函数关系。确定性关系,对于某一变量的每一个数值,都有另一变量的确定的值与之对应。 例:圆面积对于半径的依存关系,正方形的面积对于边长的依存关系等等。 相关关系。反映事物之间的非严格、不确定的线性依存关系。 1、相关关系 相关关系。反映事物之间的非严格、不确定的线性依存关系。 特点: ①事物之间在数量上确实存在一定的内在联系。表现在一个变量发生说两上的变化,要影响另一个变量也相应地发生数量上的变化。 例: ②事物之间的数量依存关系不是确定的,具有一定的随机性。表现在给定自变量一个数值,因变量会有若干个数值和它对应,并且因变量总是遵循一定规律围绕这些数值平均数上下波动。其原因是影响因变量发生变化的因素不止一个。 例:影响工业总产值的因素除了职工数外,还有入定资产原值、流动资金和能耗等因素。 2、回归分析与相关分析 研究和测度两个或两个以上变量之间关系的方法有回归分析和相关分析。 相关分析。研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。 回归分析。研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动的关系。 三、回归模型的分类: §6.2 一元线性回归预测 已知因素 x 与因素 y 有某种线性关系,设 x 为自变量,y 为因变量,现有观察值(xi, yi),i=1,2…n,则 x 与 y 之间的关系可定量表示为: 其中 ~N(0,σ2),称为误差项(或随机干扰),一般认为其服从正态分布。 实际中,用 来作为上述关系的近似,称为一元线性回归方程。 例:已知某种商品的销售量同居民的可支配收入有关,现有如下表的统计数据,试建立回归方程,并求出相应参数的最小二乘估计值。 第一步:绘制散点图 第二步:设一元线性回归方程为 第二步:设一元线性回归方程为: 三、相关系数 在运用一元线性回归模型时,正确地判断两个变量之间的相互关系,选择主要因素作模型的自变量是至关重要的。 1、离差平方和的分解 则 n 次观测值的总离差平方和为: 2、可决系数 R2=0.9911 表明该商品的销售量的变化中有99.11%部分可以用居民的可支配收入额来解释。 3、相关系数: 3、相关系数: 四、显著性检验。 (1) 相关系数检验:相关系数的绝对值达到什么程度,才能认为两个变量之间的线性相关关系是显著的? 步骤: 依据公式计算相关系数R; 根据给定的显著性水平 ? ,查相关系数临界值表(? 取值越小,显著性程度越高); 查表R?(n-2),(n 表示样本数目) 判别:若| R |≥ R ?(n-2),表明两个变量之间的线性相关关系显著,相关关系可信度较高,检验通过。否则,说明模型不能用来进行预测,这时,应分析其原因,对回归模型重新调整。 例: R = 0.9216, ?=0.01, R?=0.7977 R? R,为此显著的正相关。 因此可以认为,所求得的回归直线用于近似描述商品的销售量与居民的可支配收入额的相关关系是可靠的,即可信度较高。 (2)t检验: t检验是检验回归系数是否显著异于0。 t 检验是通过构造假设检验来检验回归模型与数据是否很好拟合的方法,通过回归模型斜率来看是否显著不等于零。 对系数 b 进行检验的检验步骤: 构造t统计量: 提出假设:H0:b=0;H1:b≠0; 根据给定的显著性水平α,查t分布表得到临界值tα/2(n-2),(n表示样本数目) 判别:若| t | ≥ tα/2(n-2),拒绝假设H0:b=0,而接受H1,即认为 b 显著异于 0,因变量 y 对自变量 x 的一元线性回归成立。若| t | tα/2(n-2)时接受原假设H0而拒绝H1 ,认为 b为零,因变量y 对自变量 x 的一元线性回归不成立。 (3)F检验(对线性回归方程显著性的另外一种检验) 步骤: 依据公式计算 F 值; 根据给定的显著性水平α,查F分布表得到临界值F α(1,n-2),(n表示样本数目) 判别:若F ≥ F α(1,n-2),表明两变量之间线性相关关系显著,检验通过。否则两变量之间线性相关关系不显著。 若统计检验通过,则认为回归方程有意义。 4.回归方程的应用 (1)预测:根据方程 ,对于某一给定的x0,可得到相应的y0
文档评论(0)