- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§6.2 一元线性回归 可线性化的一元回归问题 回归模型的拟合优度和显著性 两个变量之间的相关系数能表明两者之间关系的密切程度,但无法用一个变量去估计另一个变量。 回归分析则可做到这一点,用自变量去估计或预测因变量。回归分析首先要区分自变量和因变量,自变量是“因”,因变量是“果”,然后建立一个方程去描述这个因果关系,即要找出两者之间关系的数学表达式,这就是一元回归;如果两个变量是线性关系.称为一元线性回归。 设相关关系的两个变量为 和 , 的值由两部分构成:一部分由 的影响确定, 用 的 函数 表示,称为回归函数;另一部分则由众多不确定性因素影响产生,可看成 取值的随机波动,记为 ,并且假定其平均值为零,即 。于是得到数学模型: 上式称为回归模型,它表明当 取某个数值时, 并不必然表现为一个确定的值,而是在 附近波动,但其平均数在大量观察下趋向于确定的值 。 (6.2.1) 图6-1 企业产量与生产费用散点图 我们容易看出企业产量 和生产费用 之间的散点图大致呈直线关系。但图形中的各点并不都在—条直线上,而是围绕着直线上下波动,有的在直线上面,有的在直线下面。 各散点的坐标满足方程 对于这样的散点图,我们认为 与 之间线性相关,回归函数 是线性函数,即 此时,回归模型为 (6.2.2)式称为一元线性回归函数,(6.2.3)称为一元线性回归模型。 (6.2.2) (6.2.3) 直线截距 直线斜率 也叫做 对 的回归系数,它表示 每变动一个单位所引起的 的平均变动量 残差(也称为回归误差或预测误差),代表除 外的其它次要因素形成的随机扰动。 当样本量较大时,正负干扰可相互抵消,所以我们认为 的均值为0。 回归分析的主要任务就是确定回归方程的参数 、 并判定回归函数(6.2.2)式是否合理。 怎样确定? ? 越小越好 常用的方法是最小二乘法(Least squares,简记为LS)。它使残差平方和(residuals sum of squares :RSS)最小,即使 最小 在计算上应先求 再求 。用最小二乘法拟合的回归方程有三个性质: (1) ,即回归误差可以相互抵消。 (2)所拟合的回归线通过均值点 ,即通过散点图的重心,因而预测值 的均值等于实际值 的均值。 (3)残差 和 、 之间无相关关系。 利用求极值的方法可解得: (6.2.4) 案例6.2 根据表6.2中有关数据,确定该企业生产费用对产量的回归方程,并说明产量对生产费用的影响大小。 表6.2 企业生产费用与产量相关系数计算表 解: 由于产量多少决定着生产费用的多少,所以以产量x为自变量,生产费用y为因变量。 代入(6.2.4),得 所求的生产费用对产量的回归方程为: 它说明该企业产量每增加1千吨,生产费用平均增加12.896万元。 案例6.3某省1990-2000年工业产值y与农业产值x的统计数据(单位:亿元)如表中第2、3列所示。试求工业产值对农业产值的回归函数。 94 76 平均 102216 63860 79769 1034 836 ∑ 4624 4761 4900 6561 7225 7396 10000 11664 12996 14400 17689 4624 5041 5184 4900 5776 5929 5776 6084 6241 6561 7744 4624 4899
文档评论(0)