统计学线性回归分析.pptVIP

  • 1
  • 0
  • 约5.05千字
  • 约 36页
  • 2025-09-03 发布于广东
  • 举报

统计学线性回归分析第1页,共36页,星期日,2025年,2月5日变量之间的关系有两种:确定型的函数关系不确定型的函数关系这里主要研究不确定型的函数关系,如收入与受教育程度之间的关系,等等问题。但它们之间存在明显的相互关系(称为相关关系),又是不确定的。回归分析是研究随机变量之间相关关系的统计方法。其研究一个被解释变量(因变量)与一个或多个解释变量(自变量)之间的统计关系。第2页,共36页,星期日,2025年,2月5日例:人均收入X与人均食品消费支出Y的散点图的关系如图。1.一元线性回归是研究一个自变量与一个因变量的统计关系。一.一元线性回归人均收入X人均食品支出Y第3页,共36页,星期日,2025年,2月5日这两个变量之间的不确定关系,可以用下式表示:式中,人均食品消费支出Y是被解释变量,人均收入X是解释变量,?1,?2是待估计参数;u是随机干扰项,且与X无关,它反映了Y被X解释的不确定性。如果随机干扰项u的均值为0,对上式求条件均值,有反映出从“平均”角度看,是确定性关系。第4页,共36页,星期日,2025年,2月5日例:地区的多孩率与人均国民收入的散点图如下:人均收入X多孩率Y这两个变量之间的不确定关系,大致可以用下式表示:设Z=LnX,可将上式线性关系为:第5页,共36页,星期日,2025年,2月5日线性回归的任务:就是用恰当的方法,估计出参数?1,?2,并且使估计出来的参数具有良好的统计特征,所以,回归问题从某种视角看,视同参数估计问题。如果把X,Y的样本观测值代到线性回归方程中,就得到i=1,2,…,n,n为样本容量.从重复抽样的角度看,Xi,Yi也可以视为随机变量。第6页,共36页,星期日,2025年,2月5日2.高斯基本假设对于线性回归模型i=1,2,…,n,n为样本容量.高斯基本假设如下:ui为随机变量(本假设成立,因为我们研究就是不确定关系).E(ui)=0,随机干扰项的期望值等于零(本假设成立,如果其均值不是零,可以把它并入到?1中).Var(ui)=?2u,随机干扰项的方差等于常数(本假设有可能不成立,以后讨论不成立时如何处理).E(uiuj)=0(i?j)随机干扰项协方差等于零(本假设第7页,共36页,星期日,2025年,2月5日有可能不成立,以后讨论不成立时如何处理).(5)ui服从N(0,?2u)分布;(6)E(Xiuj)=0,对Xi的性质有两种解释:a.Xi视为随机变量,但与uj无关,所以(6)成立.b.Xi视为确定型变量,所以(6)也成立.第8页,共36页,星期日,2025年,2月5日3.普通最小二乘法(OLS)设线性回归模型其中为?1,?2的估计值,则Y的计算值?,可以用下式表达:所要求出待估参数,要使Y与其计算值?之间的“误差平方和”最小.即:使得最小.为此,分别求Q对的偏导,并令其为零:第9页,共36页,星期日,2025年,2月5日由上两式,就可求出待估参数的值.4.所求参数的计算公式的另一个表达式为:第10页,共36页,星期日,2025年,2月5日例::在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表进行。参数估计的计算表iXiYixiyiiyx2ix2iy2iX2iY1800594-1350-9731314090182250094750864000035283621100638-1050-92997587011025008637841210000407044314001122-750-44533405056250019838119600001258884417001155-450-41218558020250017007428900001334025520001408-150-1592391022500

文档评论(0)

1亿VIP精品文档

相关文档