数理统计第一次大作业回归分析.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数理统计第一次大作业回归分析

北京市农业经济 姓名: 学号: 摘 要:农业生产和农村经济是农村经济农业生产和农村经济农业生产和农村经济农林牧渔业统计范围包括辖区内全部农林牧渔业生产单位、非农行业单位附属的农林牧渔业生产活动单位以及农户的农业生产活动。军委系统的农林牧渔业生产(除军马外)也应包括在内,但不包括农业科学试验机构进行的农业生产。 农林牧渔业2005年的农业总产值为1993年的6倍。因此用统计方法研究分析农业总产值对指导国民经济生产,合理有效的进行产业布局,提高生产力等有着重要意义。 表1 北京市农业经济产值及各产品产量统计数据 本文以北京市农生产为对象,分析了农业经济总产值与粮食产量、棉花产量、油料产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量、禽蛋产量、水产品产量的关系,并建立农业经济总产值的回归模型。表1中列出了1999年至2008年间的统计数据(数据来源于北京统计信息网)。 线性回归模型的建立 2.1 线性回归模型的假设 为了研究农业经济总产值与各种农生产量的关系,必须要建立二者之间的数学模型。数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。而实际生活中,影响农业经济总产值的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立农业经济总产值的数学模型往往是很难的。但是为了便于研究,我们可以先假定一些前提条件,然后在这些条件下得到简化后的近似模型。 以下我们假定两个前提条件: 农产品的价格是不变的。这样我们可以认为每一种农产品的总产值将与产品的总产量成正的线性关系。 每一种农产品的总产值对于农业经济总产值的贡献都是很大的。因此可以根据每种产品的总产值预测农业经济总产值。即农业经济总产值与每种产品的总产值成正的线性关系。 由以上两个假设,我们可以建立农业经济总产值与各种农产品生产量的线性回归模型,模型如下: (1) 其中,是因变量, 是自变量,是各个自变量的系数。各变量符号的定义见表2。 表2 线性回归模型中各变量的含义 农林牧渔业总产值 粮 食 棉 花 油 料 蔬 菜 干鲜果品 猪牛羊肉 禽蛋产量 水产品 2.2 以上,我们通过假设两个前提条件得到了农业经济总产值与各种农生产量的线性回归模型。然而这些假设是否合理,模型又是否能很好的近似实际的经济情况,我们需要进一步的验证。作数据散点图,观察因变量与自变量之间关系是否有线性特点。散点图结果如图1所示。   (a) (b) (c) (d) (e) (f) (g) (h) 图1 因变量与各自变量的散点图 (a)农业总产值与粮食产量散点图;(b)农业总产值与棉花产量散点图;(c)农业总产值与油料产量散点图; (d)农业总产值与蔬菜散点图;(e)农业总产值干鲜果品产量散点图;(f)农业总产值与猪牛羊肉产量散点图; (g)农业总产值与禽蛋产量散点图;(h)农业总产值与水产品产量散点图 从图1中不难发现,农业经济总产值与粮食产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量具有良好的线性关系,而与棉花产量、油料产量和禽蛋产量没有明确的线性关系。水产品产量虽然与农业经济总产值呈现较强的线性关系,但是二者是负相关的,即布产量越大,农业经济总产值越小,这样不符合我们建立线性回归模型的初衷,也与建立模型的两个假设相背。 经分析,某些变量与农业经济总产值不呈正的线性相关的原因主要有两个: 与第一个假设相背。即这些农产品的价格并不是一个常数,而会随着时间的推移、生产工艺的改进、产品的淘汰等原因产生变动。当价格变动范围较大时,产品的总产值和总产量就不是线性关系了,应当用别的模型来近似。 与第二个假设相背。即这些农产品的总产值对于农业经济总产值的贡献非常小,以至于某种农产品总产值的变化不足以引起农业经济总产值的变化。如图1,可以明显发现最后三种轻农产品的产量与农业经济总产值都不具有良好的正的线性关系,而前六种重农产品中有五种与农业经济总产值呈现强的线性关系,说明重农在农业经济中占的比重比轻农要大。 在后来的逐步回归分析结果中我们可以看到,这些不符合假设条件,与农业经济总产值呈弱的或者负的线性关系的自变量都被排除到回归模型之外了。但是并不是说所有与因变量呈强线性关系的自变量都在回归模型中,在最终确定回归方程之前还应当应当用逐步回归方法进行分析。 3.逐步回归分析 3.1 线性回归的方法 线性回归是描述一个因变量Y与一个或多个自变量X之间的线性依

您可能关注的文档

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档