- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
混合截面数据
混合截面数据 independently pooled cross section 什么是混合截面数据 是横截面数据和时间序列并存的二维空间 在不同时点,从一个大总体里进行多次随机抽样 把不同时点抽取的随机样本合并起来就构成了一个独立混合截面数据 在每一个时点上进行的都是随机抽样,所以混合截面数据是由独立抽取的观测值构成,为我们使用OLS回归提供方便(也是与综列数据的区别) 为什么要使用混合截面数据 加大样本量,提供更加精密的估计量 通常将不同年份的横截面数据混合在一起,能较好的分析一项新政策的影响 能让我们看到一个关键的变量如何随时间的变化而改变 使用时可能遇到的问题及解决办法 因为数据都是随机抽样,处理混合截面数据的方法和处理横截面数据很相似,许多处理横截面数据的方法都能够用来处理混合截面数据。但以下的几点与处理横截面数据的区别仍需注意: 使用时可能遇到的问题及解决办法 Q: 混合在一起的不同时点的数据应该被“一视 同仁”么? A: 我们在处理横截面数据时会认为样本中的每一个数据对最终结果的作用都是相同的。而在混合截面数据中,因为受到时间的影响,不同时点上抽样的数据可能对最终回归的结果产生不同的影响,所以不同时点但混合在一起数据在进行OLS时不能“一视同仁”,而需要增加时间虚拟变量。 使用时可能遇到的问题及解决办法 解决办法:加入时间虚拟变量(dummy) Kids=α+δ*y(time) +β*X+u 通常,会设定最早的一年是基期 公式中的y(time)是观测期。如果数据属于观测期的样本,则y(time)=1,否则为0 这样就通过调整截距来控制不同时点观测到的数据对因变量的影响问题 使用时可能遇到的问题及解决办法 我们可以把时间虚拟变量也看成是一个控制变量,在去控制了时间对于因变量的影响后,我们就能够对不同时点观测到的数据心安理得的用横截面的方法分析 或者我们把它看成是控制了其他可观测因素后的这段时间里被解释变量会出现什么变化,例子中的δ解释的就是在观测期到基期这段时间里,控制住其他变量后,妇女生育的变化 使用时可能遇到的问题及解决办法 Q:如果不单纯的考虑时间变化对因变量的影响,而是想考虑某些解释变量对因变量的作用在一段时期里是否发生了变化,应该如何调整解释变量与时间虚拟变量的关系呢? A:通常用时间虚拟变量和想要了解的解释变量的交互作用来解决。在pooled data里主要是时间虚拟变量,而在其他类型的数据中也可以用其他虚拟变量和想要解释的变量做交互。 解决方法:设交互项 使用时可能遇到的问题及解决办法 wage= α+δ0*y(time)+β1*educ+δ1*y(time)*educ+u 其中,δ0是时间对于工资的影响 β1是基期的解释变量对因变量的影响 δ1(difference-in-differences estimator) 是多受一年教育的回报经过从基期到观测期这段时间变化了多少 应用实例 美国某市要兴建一座垃圾焚化炉(1978-1981) 需要检验的假设是:靠近垃圾焚化炉的房价要比远离焚化炉房价低 方程1:rprice=γ0+γ1*nearinc+u nearine为虚拟变量,靠近(3公里以内)为1,否则为0 代入1981年的数据会得到: rprice=101307.5-30688.27nearinc (3093.0)(5827.71) 应用实例 把1978年的数据代入方程,则会得到rprice=82517.23-18824.37nearinc (2653.79)(5827.71) 说明在修建焚化炉之前,靠近焚化炉位置的房价就要低于远离焚化炉位置的房价,因此直接用1981年的数据并不能说明新建焚化炉会压低房价 应该将实施政策前两地房价的差从政策对房价的影响中扣除 实际的影响=-30688.27-(-18824.37)=-11863.9=δ1 Rprice=β0+δ0y81+β1nearinc+δ1y81*nearinc+u 应用实例 总的说来,我们在应用时,可以通过回归得出δ1的估计量 Y=α+δ0*d2+β1*dB+δ1d2*dB+other factors 或用δ1 =(y2,B-y2,A)-(y1,B-y1,A)来度量政策的效果 其中y表示平均,第一个下标表示年,第二个下表表示组 使用时可能遇到的问题及解决办法 还需要注意的问题: 所找的抽样用的总体应该足够大,否则在不同时点随机抽样时会很容易抽到许多相同的样本点,使混合截面数据出现综列数据的某些特征。 所估计的方程也可能会产生误差项的异方差问题(BP检验),可通过OLS估计后产生的异方差的解决办法(WLS),
- 软件下载与安装、电脑疑难问题解决、office软件处理 + 关注
-
实名认证服务提供商
专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!
文档评论(0)