回归建模的一些新方法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归建模的一些新方法

回归建模的一些新方法 王明进 博士 北京大学光华管理学院 2008年6月11日 主要内容 线性回归模型(回顾) 分位数回归模型 非参数回归 半参数回归模型 总结与讨论 1. 线性回归模型 从一个例子开始 国家统计局2004年中国城市入户调查数据,随机抽取5000个人组成的样本; 具体变量: 年收入(y: 元); 受教育年限(x1: 接受正规教育年数,研究生18.5,本科15.5, 专科14.5, 中专高中11.5, 初中8.5, 小学5.5,未上学或文盲0); 性别(x2: 男0,女1); 是否属于东部地区(x3: 是1, 否0); 工龄(x4:参加工作年限); 年龄(z). 收入的分布 收入取对数之后的分布 对收入分布的统计描述 回归分析(regression analysis) 理解一个变量当中的变异性:与什么因素有关,是什么因素导致的. Sir Francis Galton (1822-1911) 回归函数 对收入变异性的理解 从人力资本投资的角度理解收入的差异; 明瑟(Mincer, 1958, 1974)收入函数: 明瑟收益率(个人教育的收益率): 一个扩展的Mincer收入函数 写成矩阵形式 回归系数的最小二乘估计 当 时, 系数的估计值 解读得到的结果 传统回归模型的局限 回归函数: 只是条件分布的均值; 条件方差: 常数?(同方差假设); 条件分布: 正态?(古典假定); 回归函数形式的设定:线性形式? 2. 分位数回归模型 条件分布的分位数 一个现实的例子: 如何判断孩子的身高体重是否正常? (线性)分位数回归模型 (Koenker Bassett, 1982) 或者写成 这里的 参数的估计 其中 估计系数的(渐近)协方差矩阵 对协方差矩阵的估计 用分位数回归计算教育的收益率 Buchinsky (1994, 1998) 系数估计结果 不同分位数下对应的教育收益率 不同分位数下对应的男女收入差距 不同分位数下对应的地区收入差距 直接针对收入进行的分位数回归 估计结果 教育导致的绝对收入的差距 给出条件分布的更详细的信息 一个大学毕业在东部地区工作的男性,他的收入随着工龄变化: 分位数回归的有关问题 特别适合于条件分布具有异方差的问题; 如果除了常数项之外,不同分位点对应的其它回归系数都相同,那么意味着条件分布的变异特征一样,此时没有必要用分位数回归; 分位数回归函数的设置 3. 非参数回归 回归函数的非参数形式 其中假定: 是一个光滑函数; 误差项满足 非参数回归的任务 给定一组样本 ,如何得到对 甚至它的导函数的估计? 基本思想: 在x的一个小的范围内,可以用直线(多项式)近似,可以用落在该范围内的样本点来估计出这条直线(曲线)。 回归函数的局部线性近似 局部线性回归估计(1) 用落在 x 临近的样本观测估计如下的线性模型 其中对 的估计将分别给出 及其导函数在 x 处值的估计 局部线性回归估计(2) 所以 核函数及其作用 带宽系数(h)的作用 收入与年龄的关系:局部线性回归 带宽的选择--- GCV函数 其中 常被称为帽子矩阵 该例子的 GCV函数 非参数回归的有关问题 进行非参数回归的其它方法: 注意的问题: 样本不能太小; 自变量不能太多(curse of dimensionality). 4. 半参数回归模型 Mincer收入函数的一个自然拓展 工龄对收入的影响为什么是二次曲线?有没有可能更出更合理的形式?这对估计教育收益率有什么影响吗?(王明进、陈良焜 , 2008) 部分线性模型(PLM) 其中 部分线性模型的估计 其中 是对 进行非参数回归时对应的帽子矩阵。(Speckman, 1988; Hamilton, 1997) 对收入数据的估计结果 估计得到的工龄的函数形式 将参数模型中工龄曲线设置为四次… 更深入的推广 教育收益率是否与工龄有关? (王明进、岳昌君, 2008) 变

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档