本科统计学第十二讲 回归和相关.pptVIP

  • 1
  • 0
  • 约1.03千字
  • 约 30页
  • 2020-08-23 发布于福建
  • 举报
第十二讲回归与相关 第一节回归研究的对象 1、研究定距变量与定距变量之间的非确定关系 相关关系:1)变量之间存在关系 2)这种关系是非确定性的 两个变量x和y,当x变化时会引起y相应变化,但他 们之间的变化关系是不确定的。如果当x取任何一可 能值x时,y相应地服从一定的概率分布,则称随机 变量y和变量x之间存在着相关 社会现象之间有哪些属于相关关系? ÷2、散布图 d c X3 X ÷3、回归方程与线性回归方程 ÷1)回归方程 E 令自变量不同取值时,因变量y平均值的变化。 ÷2)线性回归方程(一元) 当因变量y的平均值与自变量x呈线性关系时 E()=a+B(x) 问题:用y=a+A()这个方程表示的回归线性 方程应该在坐标图上的哪一个位置,才使预 测时所犯错误最小? 第二节回归直线的建立与最小二乘法 1、直线回归方程的建立 今通过样本值作散布图,由散布图估计出 总体回归直线的系数a、B,建立直线 回归方程 但:抽样误差存在,样本均值并不等于 总体均值,要获得一条最佳的估计直线, 用最小二乘法。 s2、最小二乘法 设总体中抽取一样本,围绕n个观测点画 条直线y=a+bx,与各点都比较接近 的直线为最佳。要求:各点到待估直线 的铅直距离之和为最小。利用微分学中 求极值的原理,求得: a=y-bx 将a、b代入线性回归方程:x y=a+bx 今它是总体线性回归方程y=a+(x)的最 佳估计方程 例:妇女受教育的年限与家务劳动时间调查资料 妇女教育年限劳动小时×xy 10425 8416 ABCDEFGH|E 223344 5443 12916 9|9 944000 161 161 4 16 6 36 000 8 000 64 36 18 4717468 第三节回归方程的假定与检验 线性回归模型基本假定的界定 ②非随机变球,值可认为是无误差的 冷2、由于x和y之间存在非确定性的相关关 系,因此要求y的所有子总体的方差都相 冷3、y的所有子总体,其均值都在一条直 线上,称做线性假定。 E(y)=a+(x) 4、要求随机变量y是统计独立的 以上假定用两组数据结构来表达: 1)随机变量y是独立的,且有: 今均值:E(y)=a+(x) 今方差:Dy)=a ÷2)y与x有如下关系 y=a+(x)+6 R是随机变量,它们相互独立,且 Ea=o d(a 5、处于检验的需要,要求y值的每一个子 总体都满足正态分布。

文档评论(0)

1亿VIP精品文档

相关文档