c6多元回归分析报告报告材料-进一步地专地的题目.doc

下载文档

5
0
约2.26千字
约 7页
2018-12-18 发布于安徽
举报
版权申诉
保障服务

c6多元回归分析报告报告材料-进一步地专地的题目.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

实用标准文案精彩文档第6章多元回归分析: 进一步的专题摘要: 本章进一步讨论若干多元回归分析问题，对实证分析很有帮助。 6.1 OLS统计量的数据缩放效应在C2中简单讨论了变量的单位变化对回归参数和R2值的影响。由于R2值实际上是y的拟合值和实际值相关系数的平方，所以其不会受数据缩放的影响。类似地，可以预期变量单位改变对回归参数及其标准误、回归标准误、置信区间、t统计量、F统计量的影响。见如下的例子: 第二列改变了因变量的单位，从原来的盎司改为镑(数据缩小16倍)；第三列改变 Beta系数在某些实证分析中，自变量的现实意义是很难解释的，例如，在劳动经济学中，经常收集一些得分数据，这些数据变量的分数设置是很任意的，从而解释起来比较困难。此外，我们有时也希望了解不同类型的自变量在模型中的重要程度。此时，对因变量和自变量进行标准化后，再进行回归建模，可能是一个不错的选择。也就是，我们可以讨论自变量增加或减少一个标准差后给因变量带来的影响。有如下的OLS回归方程： yi 用它们的平均方程去减它们： yi 标准化后得到： yi 或者改写成称: zy 上述的Z变量分别被称为y和各个自变量的z-得分。问：哪些重要的统计量不会被改变？ 6.2 函数形式的再讨论对数函数形式讨论如下的回归方程: log? 在该问题中由于rooms的变化单位是1，这是自变量的很大变化。在固定nox的前提下，100 β2 =100*.306来近似%? %? 在此例子中，当增加1个房间时，%?y=35.8% 对变量取对数的优点:1)正态化y(对称化，减小厚尾和异方差现象)，使其更容易满足CLM；2）减小异常值的影响。含二次函数(Quadratic functions)的模型二次函数可用于对单增或单减的边际效应的建模。若回归方程为： y= ?y≈(β 带交叉项的模型(Models with interaction terms) price= 请解释上述回归方程中交叉项所表示的含义？我们更倾向于在均值(中值)、上四分位数或下四分位数处讨论模型。因此，对回归模型: Stndfnl=2.05-.0067atndrte-1.63priGPA-1.28ACT+.296priGPA2+.0045 ACT2+.0056priGPA.atndrte (1.36) (.0102) (.48) (.098) (.101) (.0022) (.0043) N=680,R-方=.229,修正R-方等于=.222; 讨论priGPA的均值2.59处的偏效应，则有 ?Stndfnl≈{-.0067+.0056*2.59+.0056(priGPA-2.59)}. ?atndrte={.0078+.0056(priGPA-2.59)}. 请检验.0078是否统计显著？ 6.3 修正R-方 R2=1-SSR/nSST/n,由此可以定义总体R2( 几点说明: 1) R2仍然不是总体p2一个无偏估计；2）它在变元个数和SSR之间做了一个适当的权衡；3）一个新变量进入模型当且仅当其t值大于一个单位；一组新变量进入模型当且仅当其联合显著性的F值大于一个单位；4）应用修正R2 非嵌套模型(nonnested models)是指任意一个模型并不是其它模型的特例。有时变量间的共线性会使得本来显著的变量变成不显著，那么我们只能互斥性地选择其中的部分变量。此时，修正R-方比起R-方和F统计量都较优。但要注意，修正R-方只能在因变量都相同的非嵌套模型间做出选择。在回归分析中控制了太多因素有时引入一个变量难以让人理解，或者根本就控制不住，这些变量就不应该被引入。记住一句话，不同的模型服务于不同的目的。加入回归元来减少标准误如果一个自变量和其它自变量不相关，那么引入它通常可以减少回归标准误。 6.4 预测和残差分析预测(Predictions)受限于抽样方差，本节讨论因变量预测的置信区间。残差分析也能提供额外的信息。预测的置信区间(Confidence Intervals for Predictions) 有关于被预测变量某点取值的总体方程: θ0 其样本方程为: θ0 如何得到该点的置信区间?方法是将被预测变量某点取值的总体方程代入总体模型，消去β0得 y=θ 然后估计即可。上述方法可以得到均值方程的区间估计。对于某个样本值y0，其置信区间（预测区间，prediction interval y0=β 由于θ0和u0相互独立和预测误差(prediction error u0 从而，Varu0=Var 从而有u0的标准误: se(u0)=σ2+Var 残差分析(residual analysis)