- 212
- 0
- 约4.09千字
- 约 3页
- 2022-11-09 发布于浙江
- 举报
Asymptotics
如果 OLS 不是无偏的, 那 consistency 是对估计量的起码要求. 一致性是指在样本容量趋于
无穷时, 估计量的分布会集中在估计值的点上. 在四个初始假定下, OLS 估计量都是一致估
计. 而如果放宽OLS 的假定,把zero conditional mean 拆成两个假定E(u)=0 和Cov(x,u)=0, 即
u 的期望值为0 且与x 不相关, 这时候即时条件均值假定不成立, OLS 不是无偏, 仍可以得到
一致估计.
如果任何一个x 与u 相关, 就会导致不一致性. 而如果遗漏一个变量x2 而其又与x1 相关, 就
会导致不一致性. 如果被遗漏变量与任何一个其他变量都不相关, 则不会导致不一致性. 如
果x1 与u 相关, 但x1 与u 都与其它变量不相关, 则只是x1 的估计量存在不一致性.
非正态的总体不影响无偏性和BLUE,但是要做出正确的t 和F 统计量估计需要有正态分布
的假定(第6 个假定)。但只要样本容量足够大,根据中心极限定理,OLS 是渐进正态分布
的。但这必须以homoskedasticity 和Zero conditional mean 为前提。这时OLS 估计量也具有
最小的渐进方差。
Dummy variable 用来衡量定性的信息
对于dummy variable,设置0 和 1,便于做出自然的解释;如果在一个函数中添加了两个互
补的dummy variables ,就会造成dummy variable trap ,导致perfect collineartiy ;那个没有被
加入模型的会形成互补的variable ,通常被成为base group (基组)。
Intercept Dummy variable :单独作为自变量加上系数后出现。在图上只表示为intecept shift ,
图形只是截距发生了平行迁移。
如果male 为1,那女性截距就是α,男性截距是γ+α。
Slope Dummy variable:作为自变量的一个interaction variable 出现。会影响到自变量的slope。
sqft 的斜率变为B1+r
当然,也可以同时加入intercept 和slope variables 。
当加入的dummy variables 不显著时,应该考虑会不会出现multicolinearity 。通过检验变量间
的相关性可得到。另外,对虚拟变量同样使用t 检验。
虚拟变量的定性分析可视为政策分析(policy analysis )的例子,program evaluation 项目评价
是一种特殊的政策分析,在项目评价中,把对象分为对照组(control group )和试验组
(experimental group )。
当因变量为 log (y )时,就对虚拟变量做百分比解释 当因变量是 log(y)=a 时,要求y的
a a
拟合值,不是e 而是 100 (e - 1)
如果有2 个虚拟变量4 个选择,想衡量4 种选择的情况,就需要设置3 个dummy 。
像穆迪所做的评级那样,有时会涉及到几个等级的序数变样(ordinal variables ),这时需要
将其中一个等级作为基组(base group ),其他的每级设一个变量。
虚拟变量的交互作用
加入交互项 eg. 在male 和married 中加入male*married ,之后三个系数相加就是married male
相对unmarried female 的系数差异。
两组变量的回归(检验两组变量是否适用于同一个模型,例如 house price 在 university 和
town 是不是能用同样模型来决定)
方法是加入 town
原创力文档

文档评论(0)