网站大量收购独家精品文档,联系QQ:2885784924

多元统计分析第四 多元回归分析.doc

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计分析第四 多元回归分析

第4章 多元回归分析 简单说,回归分析是根据统计资料建立经验公式的统计方法。例如统计若干焊接点数 据,从而建立由焊接点直径预报焊点剪切强度的预报公式;又如统计若干棵松树的胸径与材积(可利用木材体积),建立由胸径预报材积公式,也用到回归分析方法。当然回归分析不只是建立预报公式,还要对预报误差的大小,预报公式的合理性等问题讨论,有着非常丰富的内容。回归分析可用于预测和控制,在自然科学,社会科学和应用技术中都有重要应用,它是统计学最重要的工具。回归分析方法和理论从Gauss提出最小二乘法开始,至今已近200年,目前仍在蓬勃发展,例如在回归诊断、维度缩减、半参数回归、非参数回归、LOGISTIC回归等方向不断有新的突破。本章介绍参数回归分析模型及其参数估计、检验、模型选择等理论和有关计算方法。参数回归分析主要分三类:线性回归、可以转化为线性回归的回归和非线性回归。本章依次介绍这三类模型。有关回归分析的一般理论可参见陈希儒(1984),方开泰(1988),Seber(1976),何晓群(1997),何晓群、刘文卿(2001)、Richard(2003)。 Robert(1999)和王吉利(2004)提供了许多有趣的应用例子。 4.1多元线性回归模型 首先让我们看一个例子: 例4.1 对15个地区调查某种护肤霜销量得表4-1,其中y表示销量(打),表示目标 人口数(千人),表示人均可支配收入(美元)。试建立由目标人口和人均可支配收入预测销量的公式。 表4-1 护肤霜销量数据 销量(打)y 目标人口(千人) 人均可支配收入(美元) 162 274 2450 120 180 3254 223 375 3802 131 205 2838 67 86 2347 169 266 3782 81 98 3708 192 330 2450 116 195 2137 55 53 2560 252 430 4020 232 372 4427 144 236 2660 103 157 2088 212 370 2605 这个问题中,每个地区销量受该地区目标人口数和人均可支配收入数影响,3个变量y、、间存在密切关系。但是它们的关系不是确定性关系而是相关关系。 常见的变量间关系分为两大类:确定性关系和相关关系。确定性关系也称为函数关系。具有确定性关系时,自变量完全确定因变量的值。例如存款的年利率c固定,那么存款数z与总利息y的关系就是确定性关系;z知道后,y就由y=cz确定。又如自由落体的下落高度s与下落时间t的关系也是确定性关系。现实世界中大量存在相关关系,具有相关关系的变量间不能完全确定,例如焊接点直径与焊点剪切强度(焊接点被拉断所用的力)是两个变量,它们关系密切,但是焊接点直径不能完全确定焊点剪切强度,焊接点直径是1毫米的焊点,剪切强度是不确定的。但总起来说,它比焊接点直径是2毫米的焊点,剪切强度要小,统计数据证明焊接点直径与焊点剪切强度近似存在线性关系,焊接点直径与焊点剪切强度就是相关关系。又如学生平时成绩与期末考试成绩关系很密切,但是平时成绩不能完全确定期末考试成绩,平时成绩与期末考试成绩关系就是相关关系。例4.1中,y、、间存在密切关系。但是它们的关系不是确定性关系而是相关关系。 具有相关关系的变量间,由一些变量可以大体预报其它变量。前者称为自变量,也叫解释变量或预报因子,例4.1中的和就是自变量;被预报量称为因变量,也叫做响应变量或预报对象,例4.1中的y就是因变量。回归分析的初步目的是,得到由自变量预报因变量的公式,以便通过自变量去预测或控制因变量。对于线性回归模型中的自变量,有两种处理方法:一种当作确定性变量处理,另一种当作随机变量处理,所得计算公式相同。本书采用前一种处理方法。 回归分析是建立预报公式的一种方法。其一般步骤是:首先取得自变量和因变量的多次观测值,这些观测值可能是实验得到的,也可能是调查出的;然后根据这些数据确定经验公式的类型,建立数学模型,列出待估参数;再用这些数据进行拟合,得到待估参数的估计值;最后作统计分析。数据拟合是计算方法的内容,它也能解决回归分析中的数据拟合,但回归分析与计算方法的数据拟合不同,计算方法的数据拟合只估计未知参数,而回归分析不仅仅估计参数,而且要对拟合的结果作统计分析。最简单的回归模型是线性回归模型,本节就介绍线性回归模型。 我们从例4.1的观测数据出发,建立地区销量由该地区目标人口数和人均可支配收入数预报的经验公式,以此介绍多元线性回归模型建立过程。 对例4.1容易看出:目标人口数越多,地区销量越大;人均可支配收入数越大,地区销量越大。但还会遇到随机因素的影响,从而3个变量y、、间是相关关系,于是建立数学模型

文档评论(0)

ikangdwe + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档