第十一章一元线性回归.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章一元线性回归

第十一章 一元线性回归 11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号 产量(台) 生产费用(万元) 企业编号 产量(台) 生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 55 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 要求: (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数。 (3)对相关系数的显著性进行检验(α = 0.05),并说明二者之间的关系强度。 解:(1)利用Excel的散点图绘制功能,绘制的散点图如下: 从散点图的形态可知,产量与生产费用之间存在正的线性相关。 (2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线性相关系数r = 0.920232。 (3)计算t统计量,得到t = 7.435453,在α = 0.05的显著性水平下,临界值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著的正线性相关关系。r大于0.8,高度相关。 11.2 学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一个随机样本,得到的数据如下: 复习时间x 考试分数y 20 64 16 61 34 84 23 70 27 88 32 92 18 72 22 77 要求: (1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。 (2)计算相关系数,说明两个变量之间的关系强度。 解:(1)利用Excel的散点图绘制功能,绘制的散点图如下: 从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关系。 (2)r = 0.862109,大于0.8,高度相关。 11.3 根据一组数据建立的线性回归方程为 。 要求: (1)解释截距的意义。 (2)解释斜率意义。 (3)计算当x = 6时的E(y)。 解:(1)在回归模型中,一般不能对截距项赋予意义。 (2)斜率的意义为:当x增加1时,y减小0.5。 (3)当x = 6时,E(y) = 10 – 0.5 * 6 = 7。 11.4 设SSR = 36,SSE = 4,n = 18。 要求: (1)计算判定系数R2并解释其意义。 (2)计算估计标准误差se并解释其意义。 解:SST = SSR+SSE = 36+4 = 40, R2 = SSR / SST = 36 /40 = 0.9,意义为自变量可解释因变量变异的90%,自因变量与自变量之间存在很高的线性相关关系。 (2) = 0.5,这是随机项的标准误差的估计值。 11.5 一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,因此,他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下: 运送距离x 运送时间y 825 3.5 215 1.0 1070 4.0 550 2.0 480 1.0 920 3.0 1350 4.5 325 1.5 670 3.0 1215 5.0 要求: (1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 解: (1)利用Excel绘制散点图,如下: 从散点图的形态来看,运送时间和运送距离之间存在正的线性相关关系。 (2)计算的相关系数为0.9489,这是一个很高的相关系数。 (3)用OLS方法估计得到模型参数为= 0.118129,= 0.003585, 回归方程为:运送时间 = 0.118129 + 0.003*运送距离,意义为:运送距离每增加1km,运送时间增加0.003383天,即0.086小时。 11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP(元) 人均消费水平(元) 北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州 2662 1608 陕西 4549 2035 要求: (1)人均GDP作自变量,人均消费水平左因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的

文档评论(0)

tianma2015 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档