- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 8 章 相关分析及回归分析
* 8.2.3 多元线性回归模型 1. 多元线性回归模型的参数估计 利用最小二乘法估计模型的参数 * 参数估计值应该是下列方程组的解: * 定义矩阵: 方程组可以用矩阵表示成: 参数的最小二乘估计为 * 2. 参数的估计误差和置信区间 参数估计值的标准差为 为矩阵 对角线上的第i个元素 对于给定的置信度1-?,参数的100(1-?)%置信区间为: * 3. 多元回归模型中的相关分析 多元回归分析中,由于变量总数不止两个,因变量与多个自变量的组合产生一定的依存关系;同时任何两个变量之间的相关关系都可能受到其余变量的影响。为此需要对已建立的多元回归模型进行相关分析,包括复相关和偏相关。 * (1)复相关 在多变量情况下,复相关系数是用来测定因变量 与一组自变量 之间相关程度的指标。其计算公式为: 复相关系数的值域在0到1之间,它的值为1,表明 与 之间存在严密的线性关系;它的值为0,则表明 与 之间不存在任何线性相关关系;它的取值在0和1之间时,表明变量之间存在一定的线性相关关系。 * (2)偏相关 在多变量情况下,偏相关系数是用来测定当其他变量保持不变的情况下,任意两个变量之间相关程度的指标。它主要考察两个变量之间的净相关关系,从而反映现象之间的真实联系。以两个自变量的情形为例: x1和y偏相关系数: x2和y偏相关系数: * 回归分析是要通过样本所估计的参数来代替总体的真实参数。 在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。主要包括拟合优度检验、模型的显著性检验和变量的显著性检验,以及预测。 8.3 回归模型的统计检验和预测 * 8.3.1 模型的拟合优度检验 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。 度量拟合优度的指标: 判定系数(可决系数)R2 问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度? * 如果Yi=?i 即实际观测值落在样本回归“线”上,则拟合最好。可认为,“离差”全部来自回归线,而与“残差”无关。 * 对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明: Lyy=U+Q 总离差平方和 回归平方和 误差平方和 * SST=SSR+SSE Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(RSS),另一部分则来自随机势力(ESS)。 在给定样本中,SST不变,如果实际观测点离样本回归线越近,则SSR在SST中占的比重越大,因此 拟合优度:回归平方和SSR/Y的总离差SST * 可决系数R2统计量 称 R2 为(样本)可决系数或判定系数 可决系数的取值范围:[0,1] R2越接近1,说明实际观测点离样本线越近,拟合优度越高。 * 8.3.2 模型的显著性检验 模型的显著性检验,就是检验模型对总体的近似程度,即检验因变量y和模型中所以自变量的线性关系是否显著。通常构造F统计量进行检验,称为F检验。 对多元线性回归模型 * 基本步骤如下: 1、提出假设 2、计算检验统计量: 3、对给定的显著水平?确定临界值 4、得出检验结论: 如果 ,则否定原假设,表明回归模型是显著的;反之,就不能否定原假设。 * 8.3.3 解释变量的显著性检验 变量的显著性检验是判断解释变量X是否对被解释变量Y具有显著的线性性影响,主要是针对变量的参数真值是否为零来进行显著性检验的。 多元线性回归模型, 检验某个自变量 x 对y是否有显著影响,进行解释变量的显著性检验。 * 检验步骤: 1、对总体参数提出假设 4、 比较,判断 若|t|t?/2(n--k-1),则拒绝H0 ,接受H1 ; 若|t|? t?/2(n-k-1),则拒绝H1 ,接受H0 ; 2、构造检验统计量 3、对给定的显著水平?确定临界值t ?/2(n-k-1) * 注意: 在一元线性回归分析中,回归系数的显著性检验与回归模型的显著性检验是等价的,因此 t 检验和F 检验的结论是一致的。 但在多元回归分析中,它们是不等价的,t 检验只检验方程中各个系数的显著性,而 F 检验则检验的是整个方程的显著性。 * 1、点预测 对于一元线性回归模型 给定样本以外的解释变量的观测值Xf,可以得到被解释变量的预测值?f ,可以此作为其条件均值E(Y|X=Xf)或个别值Yf的一个
文档评论(0)