一元线性回归分析概要.ppt

回归分析的相关概念 (1)回归分析:由一个(或一组)普通变量来估计、预测某一个随机变量的观测值所进行的统计分析叫做回归分析.所求得的公式称为回归方程. (2)线性回归分析:回归分析的模型是线性的,则称为线性回归分析.即用一组非随机变量的线性关系式(一次式)来估计、预测某一个随机变量的观测值. (3)一元回归分析:研究一个随机变量与一个普通变量的相关关系的回归分析叫一元回归分析. (4)一元线性回归分析:用一个普通变量的线性关系式(一次式)来估计、预测一个随机变量的观测值的回归分析叫一元线性回归分析. 我们以后只讨论一元线性回归分析. 一、散点图与回归直线 设随机变量y与普通变量x之间存在着某种相关关系.通过试验,可得到x,y的若干对实测数据,将这些数据在坐标系中描绘出来,所得到的图称为散点图. 例1 随机抽取某地区10个家庭的年收入与年储蓄(千元)资料如下表所示: 试建立x与y之间的关系式. 从图中看出,这些点虽然都不在一条直线上, 但都分布在一条直线附近,因此可以用这条直线来近似表示y与x之间的关系,这条直线的方程称为y对x的一元线性回归方程(也称为经验公式).这条直线的方程 其中a,b称为回归系数, 表示直线上y的值与实际值是有差别的. 二、最小二乘法与回归方程 下面利用n对观测值 确定回归方程中的回归系数. 采用最小二乘法.记 我们寻找使 达到最小值的a,b. 三、一元线性回归的相关性检验 用最小二乘法求回归方程,并没有要求y与x存在线性相关关系,当y与x不存在线性相关关系时,求出的线性回归方程就没有意义了,因此我们还必须检验y与x之间是否存在线性相关关系,即进行相关关系的检验. 考虑偏差平方和 可证明 令 则 由于 且 所以 即 相关性检验的步骤如下: (1)提出原假设 y与x存在显著的线性相关关系 (2)选用统计量 根据样本值计算r的值; (3)给定显著性水平 ,按自由度 .查相关系数表,求出临界值 ; (4)做判断. 若 ,则接受 ,即认为在给定显著性水平 下y与x的线性相关关系较显著;若 ,则拒绝 ,认为y与x的线性相关关系不显著. 四、回归预测 当回归方程检验显著有效时,回归方程 就大致反映了y与x之间的变化规律.对于x取任意值x0,虽然不能精确地知道相应的y的真值,当用回归方程 可以估计出y的真值的取值范围,就是回归预测问题. 要用 去预测y的真值取值范围,只要估计出偏差 的大小即可.因为偏差通常服从正态分布,即 由正态分布的 法则知 可以证明 是 的无偏估计量,其中 于是用 代替 ,得 y的置信水平为0.99的置信区间为 y的置信水平为0.95的置信区间为 y的置信水平为0.68的置信区间为 函数关系:确定性关系,如圆的面积与半 径 变量之间的关系 相关关系:非确定性关系,如商品的销售 量与价格(不能由一个变量的 数值准确的求出另一个变量 的数值) §8 一

文档评论(0)

1亿VIP精品文档

相关文档