- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三、相关分析与回归分析 相关分析是用一个指标来表明现象间相互依存关系的密切程度。 回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。 相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。 相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。可以不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。 相关分析与回归分析之间在研究目的和方法上是有明显区别的 相关分析研究变量之间相关的方向和相关的程度。 回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学表达式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供一个重要的方法。 四、相关图 相关图又称散点图。它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。 五、简单线性相关分析 (一)相关系数 是在直线相关条件下说明两个变量间相关关系密切程度的统计分析指标。 计算公式为: (二).计算相关系数的公式: (三)相关系数的计算 具体计算样本相关系数时,通常利用以下公式: 例: 1992年-2003年我国城镇居民人均年消费性支出和人均年可支配收入的有关资料,试计算消费性支出与可支配收入的样本相关系数。 (四).相关系数的性质 (五)相关系数的检验 对总体相关系数 ? 是否等于0进行检验。 计算相关系数r的t值: 根据给定的显著性水平和自由度(n-2),查找t分布表中相应的临界值t ? /2。若| t |≥ t ? /2 ,表明r在统计上是显著的。 若| t | ≤ t ? /2 ,表明r在统计上是不显著的。 假设根据6对样本观测数据计算出某公司的股票价格与气温的样本相关系数r =0.5,试问是否可以根据5%的显著水平认为该公司的股票与气温之间存在一定程度的线性相关关系? 解:H0: ? =0; H0: ? ? 0 r的t检验值 查表可知:显著水平为5%,自由度为4的临界值t ? /2 =2.776 ,上式中的t值小于2.776,因此,r不能通过显著性检验。这就是说,尽管根据样本观测值计算的r达到0.5,但是由于样本单位过少,这一结论并不可靠,它不足以证明该公司的股票与气温之间存在一定程度的线性相关关系。 一、回归分析的概念 现实世界中大多数现象表现为相关关系,人们通过大量观察,将现象之间的相关关系抽象概括为函数关系,并用函数形式或模型来描述与推断现象间的具体变动关系,用一个或一组变量的变化来估计与推算另一个变量的变化。这种分析方法称为回归分析。 二、标准的一元线性回归模型 (一)总体回归函数 上式被称为总体回归函数。式中的? 1和? 2是未知的参数,又叫回归系数。Yt和Xt分别是Y和X的第t个观测值。u t是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对Y的影响。 (二)样本回归函数 在现实问题研究中,由于总体单位数一般是很多的,需要利用样本的信息对其进行估计。 一元线性回归模型的样本回归线可表示为: 式中的 是样本回归线上与Xt相对应的Y值,可视为E(Yt)的估计; 是样本回归函数的截距系数, 是样本回归函数的斜率系数,它们是对总体回归系数? 1和? 2的估计。 实际观测到的因变量Yt值,并不完全等于 ,如果用et表示二者之差( ), 则有: ( t=1,2,...,n) 上式称为样本回归函数。式中et称为残差。 三、一元线性回归模型的估计 (一)回归系数的点估计 所谓最小二乘法就是通过使残差平方和为最小来估计回归系数的一种方法。 将Q对求偏导数,并令其等于零,可得 加以整理后有 以上方程组称为正规方程组或标准方程组,式中的n是 样本容量。求解这一方程组可得: 例: 1992年-2003年我国城镇居民人均年消费性支出和人均年可支配收入的有关资料,估计我国城镇居民的边际消费倾向和基础消费水平。 上表已给出我国历年城镇居民人均消费支出和人均可支配收入的数据,来估计我国城镇居民的边际消费倾向和基础消费水平。 解:Yt=
文档评论(0)