1.1〔回归分析的基本思想和其初步应用〕.docVIP

  • 1
  • 0
  • 约6千字
  • 约 14页
  • 2017-06-08 发布于北京
  • 举报

1.1〔回归分析的基本思想和其初步应用〕.doc

1.1〔回归分析的基本思想和其初步应用〕

1.1 回归分析的基本思想及其初步应用 基础梳理 1.相关关系是一种非确定性关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,函数关系是一种确定性关系. 2.在线性回归模型y=bx+a+e中,最小二乘法估计^和^就是未知参数a和b的最好估计,其计算公式如下: ^=,^=,其中,-=1ni=1nxi,-=1ni=1nyi.另外,称为样本点的中心,回归直线一定过样本点中心. 3.衡量模型拟合效果. (1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为ei=yi-bxi-a,i=1,2,3,…,n,其估计值为^i=yi-^i=yi-^xi-^,i=1,2,…,n,^i称为相应于点(xi,yi)的残差. (2)残差图:我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号、身高数据或体重估计值等,这样作出的图形称为残差图. 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高. (3)残差分析:可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果. (4)相关指数:计算公式是R2=.其中残差平方和为 总偏差平方和为R2的值越大说明残差平方和越小,也就是说模型的拟合效果越好,R2的值表示解释变量对预报变量变化的贡献率,R2的值越接近于1,表示回归的效果越好.,基础自测            1.下列结论正确的是(C) ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①②  B.①②③  C.①②④  D.①②③④ 解析:根据函数关系、相关关系、回归分析的概念可知选C. 2.下列有关回归直线方程^=^x+^的叙述: ①反映^与x之间的函数关系;②反映y与x之间的函数关系;③表示^与x之间不确定关系;④表示最接近y与x之间真实关系的一条直线. 其中正确的是(D) A.①② B.②③ C.③④ D.①④ 解析:^=bx+^表示^与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系.故选D. 3.已知回归方程^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是(C) A.0.01 B.0.02 C.0.03 D.0.04 解析:(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.故选C. 4.有下列数据: x 1 2 3 y 3 5.99 12.01 下列四个函数中,模拟效果最好的为(A) A.y=3×2x-1 B.y=log2x C.y=3x D.y=x2 解析:当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,知A模拟效果最好.故选A. (一)重点 通过实际操作进一步理解建立两相关变量的线性回归模型的思想,求线性回归方程,判断回归模型拟合的好坏. (二)难点 残差变量的解释与分析及指标R2的理解. (三)知识结构图 (四)思维总结 (1)求回归直线方程的一般方法. ①作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,从而判断两个变量是否线性相关. ②求回归系数^,^,其中 称为残差平方和,残差平方和在一定程度上反映了所选回归模型的拟合效果.残差平方和越小,说明模型的拟合效果越好;残差平方和越大,说明拟合效果越差. ③通过残差分析判断模型拟合效果:先计算出残差^i=yi-^i=yi-^xi-^,i=1,2,…,n,然后横坐标选取为样本编号、解释变量或预报变量,纵坐标为残差,作出残差图.通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄说明模型拟合效果,反映回归方程的预报精度.带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高. (3)相关指数R2. ①相关指数的计算公式是R2=其中为残差平方和.相关指数用来刻画回归模型拟合的效果,R2的值越大,说明模型的拟合效果越好;R2的值越小,说明拟合效果越差. ②如果某组样本数据可以采取几种不同的回归模型进行回归分析,则可以通过比较R2的值来作出选择,即选择R2值大的模型作为这组数据的回归模型. ③在线性回归模型中R2是刻画回归效果的量,即表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系.R2表示解释变量对预报变量变化的贡献率. 1.建立回归模型的基本步骤为: (1)确定研究对象,明确哪个变量是解释变量

文档评论(0)

1亿VIP精品文档

相关文档