第8章_回归分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章_回归分析.doc

第八章 回归分析 回归和相关已成为统计学中最基本的概念之一,其分析方法已是最标准、最常用的统计工具之一。从狭义上看,相关分析的任务主要是评判现象之间的相关程度高低以及相关的方向,而回归分析则是在相关分析的基础上进一步借用数学方程将那种显著存在的相关关系表示出来,从而使这种被揭示出的关系具体化并可运用于实践中去。从广义的角度去理解相关和回归,此时回归分析就包含着相关分析。 【实例描述】 从历史上看,“回归”概念的提出是要早于“相关”的,生物统计学家高尔顿在研究豌豆和人体的身高遗传规律时,首先提出“回归”的思想。1887年,他第一次将“回复”(Reversion)作为统计概念使用,后改为“回归”(Regression)一词。1888年他又引入“相关”(Correlation)的概念。原来,他在研究人类身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身高总有向一般人口的平均身高回归的倾向。通俗的讲就是,高个子父母,其子女一般不像他们那样高,而矮个子父母,其子女一般也不像他们那样矮,因为子女的身高不仅受到父母的影响(尽管程度最强),还要受其上两代共四个双亲的影响(尽管程度相对弱一些),上三代共八个双亲的影响(尽管程度更加弱一些),如此等等 ,即子女的身高要受到其2n(n趋近无穷)个祖先的整体(即总体)影响,是遗传和变异的统一结果。 8.1 回归分析基础 回归分析最基本的分类就是一元回归和多元回归,前者是指两个变量之间的回归分析,如收入与意愿支出之间的关系;后者则是指三个或三个以上变量之间的关系,如消费支出与收入及商品价格之间的关系等。下面举几个例子说明回归分析的应用。 例如,某一品牌婴儿奶粉的销售经理想预测明年的产品需求。为了应用回归分析,他和属下列出了可能影响销量的变量: 产品价格 竞争产品价格 0~3岁婴儿的数量(目标市场) 广告的效果(广告曝光率) 前一年的销售额 当年的销售额 又如,房地产代理商想预测房屋出售价格,他认为以下变量将会影响房产价格: 地理位置 房子的面积(平方米) 卧室数量 房子朝向 房子状态 在这两个例子中,使用回归分析的根本动机是预测。 8.1.1 一元线性回归 回归分析最简单的情形是一个自变量和一个因变量,且它们有线性关系,这叫一元线性回归,即模型为Y=+X+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,方差为σ2(σ0)σ2与X的值无关。A+BX,二是不可解释的随机项ε。 与相关分析类似,总体的回归模型Y=A+BX+ε是未知的,如何根据样本资料去估计它就成为回归分析的基本任务。由此可以假设样本的回归方程如下: 上式中,、和分别为Y、A和B的估计值。 如果对变量X和Y联合进行n次观察,就可以获得一个样本(x,y),据此就可求出、的值。 求、的方法有多种,但一般是采用最小二乘法。它要求观察值y与估计值的离差平方和达到最小值,即 满足这一要求的和可由下述标准方程求出 Σy=n+Σx Σxy=Σx+Σx2 解方程得: 例8-1:为研究某类企业的生产量和单位成本之间的关系,现随机抽取10个企业,得如下数据(见表8-1): 编号 1 2 3 4 5 6 7 8 9 10 产量(万件) 2 3 4 4 5 6 6 7 8 9 单位成本(元/件) 52 54 52 48 48 46 45 44 40 38 表8-1 10个企业的生产量和单位成本情况 根据该资料,经计算可得表8-2: 编号 产量(万件) x 单位成本 (元/件)y x2 y2 xy y- 1 2 52 4 2704 104 54.35 -2.35 2 3 54 9 2916 162 52.10 1.90 3 4 52 16 2704 208 49.85 2.15 4 4 48 16 2304 192 47.85 -1.85 5 5 48 25 2304 240 47.60 0.40 6 6 46 36 2116 276 45.35 0.65 7 6 45 36 2025 270 45.35 -0.35 8 7 44 49 1936 308 43.10 0.90 9 8 40 64 1600 320 40.85 -0.85 10 9 38 81 1444 342 38.60 -0.60 合计 54 467 336 22053 2422 467 0 表8-2 一元线性回归计算表 由上表资料,可得: = - 2.25, = 58.85 这样就可以得到生产量(x)和单位成本(y)之间的样本回归方程 =58.85-2.25x 在简单线性回归方程中,为截距, 为斜率,后者表示自变量x变化

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档