统计学相关与回归分析—培训课件.ppt

统计学相关与回归分析—培训课件.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 二者的区别: (1) 相关分析中变量之间的关系是对等的;回归分析中,变量之间的关系是不对等的,将变量划分自变量和因变量。 (2) 相关分析中变量都必须是随机变量;回归分析中,自变量是给定的,因变量是随机的。 (3)相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,相关系数是惟一的。而在回归分析中,对于互为因果的两个变量 ,则有可能存在两个或多个回归方程。 * 3、回归分析的种类 一个自变量 两个及两个以上自变量 回归模型 多元回归 一元回归 线性回归 非线性回归 线性回归 非线性回归 * 4、回归分析步骤: 首先对变量之间的关系进行相关分析,并将变量分为自变量和因变量; 其次,找出合适的回归模型(即数学方程式),描述变量间的关系; 再次,对回归模型进行统计检验; 最后,统计检验通过后,利用回归模型,根据自变量去估计、预测因变量。 本节仅讨论一元线性回归分析。 * 二、一元线性回归模型 如果变量x和y相关,并且从相关图表中可以看出它们之间大致形成一种直线关系,我们就可在相关图上求出一条与各点最相配合的直线。 y=a+bx+? ? 式中x为自变量,通常由研究者事先选定数值。 a为样本回归直线在y轴上的截距; b为样本回归直线的斜率(又称回归系数),它表示当x增加一个单位时y的平均增加数量;?为误差项。 * 当只涉及一个自变量时称为一元回归,若因变量 y与自变量x之间为线性关系时称为一元线性回归。 对于具有线性关系的两个变量,可以用一条直线方程来表示它们之间的关系。 描述因变量y如何依赖于自变量x和误差项?的方程称为回归模型。 一元线性回归概念要点 * 在回归分析中,欲使所求回归直线 y=a+bx最适合于实际资料,必须使每个xi对应的指标实测值yi与回归直线确定的估计值yi的离差平方之和为最小。这样便把寻找适当直线问题转化为使 Q(a, b)达到最小条件下求出a、b的问题。 如何确定回归直线方程呢?(怎样确定参数a、b) 最小值 * 满足上述条件的a、b即为所求的未知参数。 由 化简得 ?(y?a?bx)=0 ?(y?a?bx)x=0 即: ?y=na+b?x ?xy=a?x+b?x2 因为Q(a, b)是a、b的非负二元函数,所以其最小值无疑是存在的。根据数学中的极值原理,令: * 上述方程组称为标准方程组。解之,得: a=y?bx * 将上述结果代入即可确定回归方程式为: y=a+bx ? 这个方程称为在给定样本条件下的一元线性回归方程,对应的直线称为样本回归直线。 回归方程对于不同的样本是有差别的,因而,它具有经验的特征,所以在实用上,也将它叫做经验公式。 * 教育经费(万元)x 在校学生数(万人)y 316 343 373 393 418 455 11 16 18 20 22 25 要求:(1)建立教育经费x与高校学生人数回归直线方程;(2)估计教育经费为500万元时的在校学生数。 例:某地高校教育经费x与高校学生人数y连续6年的统计资料如下表。 * 回 归 分 析 计 算 表 教育经费x 在校学生数y xy 316 343 373 393 418 455 11 16 18 20 22 25 3476 5488 6714 7860 9196 11375 99856 117649 139129 154449 174724 207025 121 256 324 400 484 625 2298 112 44109 892832 2210 x2 y2 * (1)建立回归直线方程 所以回归方程为:Y=-17.91+0.0955x (2)当教育经费为500万元时,在校学生数可以为: Y=-17.91+0.0955×500=29.84(万人) y=a+bx ? * 为了简化上述回归系数b的表达形式,引入如下离差乘积的和式: Lxy=? (x?x)(y?y) Lxx=? (x?x)2 于是,回归系数可简化为 为了相关性检验的需要,顺便引入关于 y 的离差平方和: Lyy=? (y? y )2 * 三、回归估计标准误差 回归方程的一个重要作用在于根据自变量的已知值估计因变量的理论值(估计值)。而理论值yc与实际值y存在着差距,这就产生了推算结果的准确性问题。如果差距小,说明推算结果的准确性高;反之,则低。 为了度量y的实际水平和估计值离差的一般水平,可计算估计标准误差。 估计标准误差是衡量回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散程度。 * 为了度量回归方程的可靠性,通常计算估计标准误差。它度量观察值回绕着回归直线的变化程度或分散程度。通常用Sy代表估计平均误差,其计算公式为: 注意,公式中根号内的分母是n?2, 而不是n。这是由于

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档