概率论与数理统计 9.pptxVIP

  • 0
  • 0
  • 约2.96千字
  • 约 51页
  • 2019-08-19 发布于辽宁
  • 举报
第九章 一元线性回归分析 在实际工作中,我们会经常碰到一些互相联系、互相制约的变量,它们之间存在着一定的关系。一般来说,变量之间的关系可分为两类: 一类是确定性的函数关系,另一类是非确定性的关系,称为相关关系。 对于具有相关关系的变量,虽然不能找到它们之间的确定表达式,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律,数理统计中研究变量之间相关关系的一种有效方法就是回归分析。 序言 01 一元线性回归模型 反映Y与X之间关系的最重要的数字特征当然是Y的数学期望与X之间的关系。我们称(x)=E(Y)为Y对x的回归函数。回归分析的一个重要内容就是估计(x),然后利用估计结果作预测和控制。为估计(x),通常是指定n各x的值X1, X2, …, Xn,做n次独立试验,取得Y的相应观察值y1, y2, …, yn,再由n对数据(x1, y1), (x2, y2), …, (xn, yn)来估计(x)。 实际中常先用近似作图法描绘(x)的图形.将n对观察数据(xi, yi)(i=1, 2, …, n)看成n个点,并把它们描点在坐标平面xOy上,这种图称为散点图;然后在平面上引一条直线或曲线,使它最好地与这些散点的分布相符合。一直线或曲线就近似地描绘了y=(x)的图形。当然,这是很粗糙的描述方法,回归分析为我们提供了研究回归函数y=(x)的精确统计推算方法。 画出散点图如图所示.从图中可以看出,随着广告投入费x的增加,销售额Y基本上也呈上升趋势,图中的点大致分布在一条向右上方延伸的直线附近.但各点不完全在一条直线上,这是由于Y还受到其他一些随机因素的影响.这样,Y可以看成是由两部分叠加而成的,一部分是x的线性函数a+bx,另一部分是随机因素引起的误差,即 厂家 1 2 3 4 5 6 7 8 9 广告费x 6 10 21 40 62 62 90 100 120 销售额Y 31 58 124 220 229 190 320 406 380 一般地,假设x与Y之间的相关关系可表示为 (9-1)其中a, b为未知常数,为随机误差,是人们不可控制的,且~N(0, 2),2未知,x与Y的这种关系称为一元线性回归模型.Y=a+bx称为回归直线,b称为回归系数,此时Y~N(a+bx, 2).对于(x, y)的样本(x1, y1), (x2, y2), …, (xn, yn),有 如果由样本得到式(9-1)中a, b的估计值 ,则称 为拟合直线或经验回归直线,它可作为回归直线的估计. 已知变量x,Y的n对试验数据(xi+yi)(i=1, 2, …, n),其中xi不全相同,作偏差平方和 (9-2)选择参数a, b的估计 ,使得Q(a, b)达到最小,这种方法称为最小二乘法。 为了求Q(a, b)的最小值,分别求Q(a, b)关于a, b的一阶偏导数,并令它们等于零: (9-3) 整理后得方程组: (9-4) 式(9-4)称为正规方程组。 由于xi不全相同,正规方程组的系数行列式 所以式(9-4)有唯一解,解得a, b的估计值为 (9-5) (9-6) 其中, 于是,所求的经验回归直线方程(图9-2)为 (9-7) 若把 代入式(9-7),则经验回归直线方程为 (9-8) 式(9-8)表明,经验回归直线总是过散点图的几何中心 。 我们用 (9-10) 作为2的估计值。 由式(9-8),有 即得 (9-11) 于是 (9-12) 解 按题意n=9计算可得 因而由(9-5),(9-6)两式,得 于是得到经验回归直线方程 利用式(9-12),并注意到 于是 在以上的讨论中,我们假定Y关于x的回归(x)具有形式a+bx,在处理实际问题时,(x)是否为相等线性函数,首先要根据有关专业知识和实践来判断,其次就是根据实际观察得到的数据运用假设检验的方法来判断.这就是说,求得的线性回归方程是否有实用价值,一般来说,需要经过假设检验才能确定.若线性假设(9-2)符合实际,则b不应为零,因为若b=0,则E(Y)=(x)就不依赖与x了。 因此我们需要假设检验 (9-10) 1.t检验法 若H0成立,即b=0,由定理1知, 故 为显著水平,即得H0的拒绝域为 2.相关系数检验法 取检验统计量 通常称R为样本相关系数.类似于随机变量间的相关系数,R的取值r反映了自变量x与因变量Y之间的线性相关关系。 解 t检验法:由例2,已知 查表得 假设H0:b=0的拒

文档评论(0)

1亿VIP精品文档

相关文档