《经济数学基础》 teaching_13_02.docVIP

  • 1
  • 0
  • 约1.78千字
  • 约 7页
  • 2021-09-07 发布于湖北
  • 举报
13.2 一元线性回归分析 变量之间存在着某种联系,但又不能用一个函数表达式确切地表示出来,变量之间的这种关系,称为相关关系.回归分析就是处理相关关系的数学方法. 一元线性回归 对于有一定联系的两个变量:与,在试验中得到若干对数据. ,…,. 如何获得这两个变量之间的经验公式呢? 例1 某公司研究产量与生产费用之间的关系,从公司内部随机抽取了8个部门作样本,得到数据如下: 将这8对数据都描绘在平面直角坐标系中,这是平面上的8个点,易见这8个点大体在一条带状区域内.故可认为与之间有线性关系存在,设有关系式 . (13.2.1) 然而这8个点并不都严格在一条直线上,对同一个,由(13.2.1)式就确定一个,它与观测值之间存在误差,则 ,,2,…,8. (13.2.2) 其中与是已知的,,,是未知的,为误差项,我们的目的就是利用这8对数据求出,的值,即得到(13.2.1)式,使误差最小,使用的方法是最小二乘法. 13.2.2 最小二乘法 设实测值为,…,,则式(13.2.2)可改写为 ,i=1,2, …,n. 取全部误差的平方和 . (13.2.3) 由二元函数的极值原理,应有 整理 从中解出,的最大值点,记作,. 为了方便记忆,引入记号 , . 于是有 ,. (13.2.4) 确定,的方法称为最小二乘法.我们把的估计值记作,于是得到回归方程(或称经验公式) . (13.2.5) 现在我们求例1中的回归直线方程.为了求出,,可采用列表的方法计算. 于是可以计算出 , , . 故回归直线方程为 . 13.2.3 检验与预测 对于任意两个变量的一组观测数据,,都可以用最小二乘法形式上求出回归直线方程,于是就产生下面两个问题: 是否总有意义?即自变量的变化是否真的对因变量有线性影响? 有意义,则可用来预测的值,那么与真实的有多大的偏差? (1)检验 将称为残差(或剩余), (回归值)+ (残差) 记,表示观测值总的变动情况,称为总变差(总变动平方和,也记为),它可以分解成如下形式: . 上式中交叉项 (考虑到) (考虑到). 记,, 则有         . (13.2.6) 式称为平方和分解公式. 它描述了回归值的分散程度,由公式看出的分散性又由的分散性通过对于的线性影响反映出来,因此称为回归平方和(也记作).是残差的平方和,称为残差平方和(或剩余平方和,也记为). 它是同一的观测值 与回归直线上纵坐标的偏离情况,是扣除了对的线性影响后所剩余的平方和,它主要反映了试验误差的大小. 若,则,与之间的关系非常密切;若,则,这表明与无关,一般说来,给定以后,,的大小就反映了对的影响程度,越大,则越小,对的影响就大;越小,则就越大,对的影响就小,所以,的相对比值就反映了对影响程度的高低. (13.2.2)式中的误差项独立且同分布,时,统计量 ,(13.2.2) 即服从第一自由度为1(分子的自由度)和第二自由度为(分母的自由度)的分布.给定显著水平后,可以通过查“分布临界值表”查出临界值.若由样本值算出的统计量,则检验显著,说明,的比值足够大了,即回归直线方程是有意义的;反之,若统计量,则检验不显著,说明回归直线方程是没有意义的.这种检验方法称为检验法. 在计算,的公式中,可将,作如下变形以简化计算: . 检验例1中所求回归直线方程的显著性,有 , , . 而时,,显然有,说明回归效果是显著的. (2)预测 当变量,之间的回归方程有效时,就可以用来预报真值. 通常假定,这样通过对的估计,就会知道的取值范围. 可以证明. 因此可用作为的无偏估计,记作,即 . 当然也可以用去估计标准差,记为,即 . 用准则,就有 , , 这样估计的值落在区间或内的相应概率分别近似为0.99和0.95. 例2 某种合成纤维的拉伸强度与其拉伸倍数有关,问与有什么样的相关关系?相关程度如何?用拉伸倍数预测强度的误差范围有多大? 解: 数据计算过程如下: , ,,. 故, , 因此回归直线方程为 . 又, , . 查的分布表,自由度,,可得临界值,,说明此回归方程是有意义的. 用作预报,效果如何呢?由        得 . 因此预测值与真值的偏差绝对值不超过的概率近似为0.95.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档