c6多元回归分析报告报告材料-进一步地专地的题目.doc

c6多元回归分析报告报告材料-进一步地专地的题目.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用标准文案 精彩文档 第6章 多元回归分析: 进一步的专题 摘要: 本章进一步讨论若干多元回归分析问题,对实证分析很有帮助。 6.1 OLS统计量的数据缩放效应 在C2中简单讨论了变量的单位变化对回归参数和R2值的影响。由于R2值实际上是y的拟合值和实际值相关系数的平方,所以其不会受数据缩放的影响。类似地,可以预期变量单位改变对回归参数及其标准误、回归标准误、置信区间、t统计量、F统计量的影响。见如下的例子: 第二列改变了因变量的单位,从原来的盎司改为镑(数据缩小16倍);第三列改变 Beta系数 在某些实证分析中,自变量的现实意义是很难解释的,例如,在劳动经济学中,经常收集一些得分数据,这些数据变量的分数设置是很任意的,从而解释起来比较困难。此外,我们有时也希望了解不同类型的自变量在模型中的重要程度。此时,对因变量和自变量进行标准化后,再进行回归建模,可能是一个不错的选择。也就是,我们可以讨论自变量增加或减少一个标准差后给因变量带来的影响。 有如下的OLS回归方程: yi 用它们的平均方程去减它们: yi 标准化后得到 : yi 或者改写成称: zy 上述的Z变量分别被称为y和各个自变量的z-得分。 问:哪些重要的统计量不会被改变? 6.2 函数形式的再讨论 对数函数形式 讨论如下的回归方程: log? 在该问题中由于rooms的变化单位是1,这是自变量的很大变化。在固定nox的前提下,100 β2 =100*.306来近似%? %? 在此例子中,当增加1个房间时,%?y=35.8% 对变量取对数的优点:1)正态化y(对称化,减小厚尾和异方差现象),使其更容易满足CLM;2)减小异常值的影响。 含二次函数(Quadratic functions)的模型 二次函数可用于对单增或单减的边际效应的建模。若回归方程为: y= ?y≈(β 带交叉项的模型(Models with interaction terms) price= 请解释上述回归方程中交叉项所表示的含义? 我们更倾向于在均值(中值)、上四分位数或下四分位数处讨论模型。因此,对回归模型: Stndfnl=2.05-.0067atndrte-1.63priGPA-1.28ACT+.296priGPA2+.0045 ACT2+.0056priGPA.atndrte (1.36) (.0102) (.48) (.098) (.101) (.0022) (.0043) N=680,R-方=.229,修正R-方等于=.222; 讨论priGPA的均值2.59处的偏效应,则有 ?Stndfnl≈{-.0067+.0056*2.59+.0056(priGPA-2.59)}. ?atndrte={.0078+.0056(priGPA-2.59)}. 请检验.0078是否统计显著? 6.3 修正R-方 R2=1-SSR/nSST/n,由此可以定义总体R2( 几点说明: 1) R2仍然不是总体p2一个无偏估计;2)它在变元个数和SSR之间做了一个适当的权衡;3)一个新变量进入模型当且仅当其t值大于一个单位;一组新变量进入模型当且仅当其联合显著性的F值大于一个单位;4) 应用修正R2 非嵌套模型(nonnested models)是指任意一个模型并不是其它模型的特例。有时变量间的共线性会使得本来显著的变量变成不显著,那么我们只能互斥性地选择其中的部分变量。此时,修正R-方比起R-方和F统计量都较优。但要注意,修正R-方只能在因变量都相同的非嵌套模型间做出选择。 在回归分析中控制了太多因素 有时引入一个变量难以让人理解,或者根本就控制不住,这些变量就不应该被引入。记住一句话,不同的模型服务于不同的目的。 加入回归元来减少标准误 如果一个自变量和其它自变量不相关,那么引入它通常可以减少回归标准误。 6.4 预测和残差分析 预测(Predictions)受限于抽样方差,本节讨论因变量预测的置信区间。残差分析也能提供额外的信息。 预测的置信区间(Confidence Intervals for Predictions) 有关于被预测变量某点取值的总体方程: θ0 其样本方程为: θ0 如何得到该点的置信区间?方法是将被预测变量某点取值的总体方程代入总体模型,消去β0得 y=θ 然后估计即可。 上述方法可以得到均值方程的区间估计。对于某个样本值y0,其置信区间(预测区间,prediction interval y0=β 由于θ0和u0相互独立和预测误差(prediction error u0 从而,Varu0=Var 从而有u0的标准误: se(u0)=σ2+Var 残差分析(residual analysis)

文档评论(0)

dmz158 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档