- 8
- 0
- 约1.15万字
- 约 12页
- 2017-09-22 发布于江苏
- 举报
第2章 最小二乘法和最小二乘估计
线性模型中的参数估计有多种方法,其中最小二乘法是最为著名的。即使已经发现其他方法比较优越,但是最小二乘法仍然是线性模型估计的基础方法,最小二乘估计的性质已经得到了广泛应用。
§2.1 最小二乘回归(least squares regression)
随机线性关系中的未知系数是我们考虑的重点,也是我们进行估计的主要目标。这时我们有必要区分母体变量(例如和)和它们的样本估计,对应地表示为和。母体回归方程可以表示为:
它的估计表示为:
(2.1)
与第i个数据点相关的扰动项可以表示为:
(2.2)
如果获得了回归系数的估计,则可以利用回归方程的残差来估计随机扰动项,即
(2.3)
根据这些定义和表示,可以得到:
(2.4)
母体量是每个的概率分布中的未知系数,我们希望利用样本数据来估计这些参数。虽然这是一个统计推断问题,但是我们仍然可以直观地认为应该选取向量,使得拟合直线尽量地靠近数据点。如果描述这种靠近性,需要一定的拟合准则,其中最为广泛使用的是最小二乘法。
§2.1.1 最小二乘系数向量
可以通过极小化下述残差平方和来获得最小二乘系数向量。
(2.5)
其中表示系数向量的选择。利用矩阵形式表示上述残差平方和:
(2.6)
将上述目标函数展开得到(注意利用标量的转置不变的性质):
(2.7)
极小化的一阶条件为(相当于对向量求导数,要么利用向量展开,要么利用向量求导公式):
(2.8)
假设是最小二乘的解,则它必须满足最小二乘正规方程(least square normal equations):
(2.9)
如果解释变量矩阵的满秩条件满足,则有:
这说明矩阵是可逆矩阵,因此正规方程的唯一解为:
(2.10)
注意到上述条件只是极小化问题的必要条件,为了判断充分性,我们需要求出目标函数的Hessian矩阵:
(2.11)
如果这个Hessian矩阵是正定的,则可以判断所得到的解是唯一的最小二乘解。
显然,根据正定矩阵的定义或者正定矩阵的判断准则,可知当矩阵的满秩条件满足时,矩阵是正定的,因此最小二乘解的充分性成立。
通过上述最小二乘解的表达式,我们可以得到最小二乘解的下述代数性质:
命题2.1 对于线性模型和相应的最小二乘估计,则有:
(1) 最小二乘残差的和为零。即
(2) 回归超平面通过数据的均值点,即
(3) 从回归方程中获得的拟合值的均值等于样本观测值的均值,即
证明:(1) 根据正规方程,可知:
这说明对于矩阵的每一列,都有,由于矩阵的第1列中都是1,所以得到(因此这条性质成立的前提条件是回归模型中包含常数项):
(2) 正规方程表示为矩阵形式为:
将上述矩阵方程的第一个方程表示出来,则有:
根据数据的样本均值定义,则有:
也即:
(3) 根据拟合值的定义:,即,则有:
上述矩阵方程的第一个方程可以表示为:
则有:
需要注意的是,上述命题成立的前提是线性模型中包含常数项,也就是第一个解释变量是“哑变量”形式。这样一个思考题目就是,当线性模型中不包含常数项时,结论是什么样的?
§2.1.2 投影和投影矩阵(projection and projection matrix)
获得最小二乘估计以后,可以获得下述最小二乘残差:
(2.12)
将最小二乘估计的表达式代入,得到:
您可能关注的文档
最近下载
- YC_T 199-2011 卷烟企业清洁生产评价准则.pdf VIP
- 《形势与政策》结课论论国际形势对中国发展所带来的影响.docx VIP
- 江苏省徐州市等3地2025-2026学年高一上学期1月期末学情检测数学试题含答.pdf VIP
- 小儿肺手术治疗方案选择的专家共识(2025版).docx VIP
- 物性表_索尔维 Veradel PESU VW-10200 RP,RFP,RSFP.pdf VIP
- 江苏省徐州市等3地2025-2026学年高一上学期期末考试英语试卷及答案.pdf VIP
- 烟草面试题目及答案.pdf VIP
- 《北京交通大学论文分类办法》(试行).pdf VIP
- 深度解析(2026)《YCT 590-2021卷烟工业企业设备综合效率测评导则》.pptx VIP
- 2024-2025学年苏教版六年级(上)期末数学试卷及答案.docx VIP
原创力文档

文档评论(0)