第4章多元回归:估计与假设检验.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
由于: = 0 所以有: 注意: 可决系数 该统计量越接近于1,模型的拟合优度越高。 对于三变量回归: 在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大。 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。—— 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需校正。 校正的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以校正的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。(k为解释变量的个数) 注:两个解释变量,但要估计三个参数 *2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有: 施瓦茨准则(Schwarz criterion,SC) 这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。 赤池信息准则(Akaike information criterion, AIC) 例:P158(古董钟拍卖) 校正的判定系数 有如下性质: 如果k>1,则 R2总是大于0,但 可能为负 8.4 多元线性回归模型的假设检验 假设检验 一、变量的显著性检验(t检验) 二、方程的显著性检验(F检验) 三、参数的置信区间 一、变量的显著性检验(t检验) 方程的可决系数R2虽然度量了估计回归直线的拟合优度,但R2本身却不能判定回归系数是否是统计显著的,即是否显著不为零。 因此,必须对每个解释变量进行显著性检验——偏回归系数的显著性检验,以决定是否作为解释变量被保留在模型中。 这一检验是由对变量的 t 检验完成的。 经济计量学 Chp 4——多元回归:估计与假设检验 主要内容 多元线性回归模型及其假定 多元线性回归参数的估计 多元回归模型的拟合优度 多元回归模型的假设检验 关于设定误差 实例 从单解释变量到多解释变量 一个例子: 学习目标 多元回归模型的估计问题 多元回归模型的假设检验问题 多元回归模型区别于双变量模型的特性 如何决定多元回归模型中解释变量的个数 4.1 多元线性回归模型及其假定 分析中国汽车行业未来的趋势,应具体分析这样一些问题: 中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么? (如收入、价格、费用、道路状况、能源、政策环境等) 各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后的发展前景怎样?应当如何制定汽车的 产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。 怎样分析多种因素的影响? 多元线性回归模型 多元线性回归模型:表现在线性回归模型中的解释变量有多个。 一般表现形式: i=1,2…,n 其中:k为解释变量的数目,Bj称为回归参数(regression coefficient)。 也被称为总体回归函数的随机表达形式。它的非随机表达式为: 表示:各变量X值固定时Y的均值,即总体回归线上的点。 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。于是: 模型中解释变量的数目为(k+1) 确定成分 随机成分 Bj也被称为偏回归系数,表示在其他解释变量保持不变的情况下,X j每变化1个单位时,Y的均值E(Y)的变化; 或者说Bj给出了X j的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。 其随机表示式: ei称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项ui的近似替代。 用来估计总体回归函数的样本回归函数为: 多元线性回归模型的基本假定 假设1:回归模型是参数线性的,并且正确设定 假设2:解释变量与扰动项不相关 假设3,随机误差项具有零均值、同方差,服从正态分布及不序列相关性(相当于书中的3、4、5、7等四个假设)。 多元线性回归模型的基本假定 假设4:解释变量之间不存在完全共线性,即两个解释变量之间无确切的线性关系。 在存在完全共线性的情况下,不能估计偏回归系数,即不能估计各解释变量各自对应变量Y的影响。 实际问题中,很少会遇到完全共线性的情况,但却面临高度共线性或近似完全共线性的情况。这将第三部分说明。 4.2 多元线性回归参数的估计 主要内容 1.普通最小二

文档评论(0)

smashing + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档