- 9
- 0
- 约1.32千字
- 约 35页
- 2017-04-27 发布于四川
- 举报
1.1元线性回归模型
变量的测度等级;名义测度;次序测度;间距测度;比率测度;小结;现代社会科学研究三要素;统计在社会科学中的定位;统计研究中的常见谬误;几个问题;关于回归 /wiki/Regression_analysis;多元回归分析是分析一个随机变量和多个变量之间线性关系的最常用的统计方法
------ 如销售量与价格和广告费的关系
变量分为两类:因变量和自变量
因变量必须为连续变量,自变量可以是连续的也可以是分类变量,或者是两者的混合
只有一个自变量时,称为一元线性回归模型
;变量的关系和回归的任务;一元线性回归模型;例1 ;图 2-1 我国分地区城镇居民年人均食品支出和人均收入散点图;将表 2-1 数据
带入方程(1)中,则有
上式中 为样本随机误差
回归的任务:希望得到能够对观测数据拟合最优的回归方程估计
上式称为 对 的回归方程
;最小二乘法(OLS);对误差平方和关于 求导数,并令其等于0,求关于 的联立方程组,得到
其中 表示因变量的均值,
的定义类似
由表 2-1 的数据算得
于是得到拟合 2-1散点图的回归直线
;SPSS 操作;图7-2 “Linear Regression”对话框(一);图7-3 “Linear Regression:Statistics”对话框; 图7-4 “Linear Regression:Plots”对话框 ;图7-5 “Linear Regression:Save”对话框 ;图7-6 “Linear Regression:Options”对话框 ;一元回归系数的意义;变量变换;模型的假设条件;符合上述假设条件的回归模型称为一般线性回归模型
对于一般线性回归模型,最小二乘估计 分别是总体参数 的无偏估计
如果我们的目的只是求未知参数的点估计,符合上述假设的一般线性回归模型也就足够了
如果还需估计总体参数的置信区间,或者需要做假设检验,则需考虑总体误差项的概率分布
;正态误差假定:
在高斯假设条件的基础上,假设随机误差项 服从正态分布,则 (1)定义的线性模型称为正态误差模型
基于高斯假设,可知N个随机变量
相互独立且服从同一正态分布
样本统计量 也都是服从正态分??的随机变量
;假设误差项服从正态分布的合理性:
(a) 中心极限定理
(b) 由于模型参数的检验以 分布为基础,误差项如果稍微偏离正态分布,对参数检验的影响也不会很大(统计上称为“稳健性”)
线性回归大都采用正态分布的标准假定,但并不是所有的数据都符合这个假定
;总体方差的估计;未知参数和 的标准误及区间估计 ;违反假设条件对最小二乘法结果的影响;作业
原创力文档

文档评论(0)