分位数回归PPT.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分位数回归PPT

分位数回归 一、分位数回归的提出 二、分位数回归及其估计 三、分位数回归的假设检验 一、分位数回归的提出 传统的回归分析主要关注均值,即采用因变量条件均值的函数来描述自变量每一特定数值下的因变量均值,从而揭示自变量与因变量的关系。这类回归模型实际上是研究被解释变量的条件期望,描述了因变量条件均值的变化。 人们当然也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。这就是分位数回归,它最早由凯恩克(Koenker Roger)和巴西特(Bassett Gilbert Jr)于1978年提出,是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法,强调条件分位数的变化。 分位数回归估计与经典模型的最小二乘估计相比较,有许多优点。 当数据出现尖峰或厚尾的分布、存在显著的异方差等情况,最小二乘估计将不再具有优良性质,且稳健性非常差。分位数回归系数估计结果比OLS估计更稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。 最小二乘估计假定解释变量只能影响被解释变量的条件分布的均值位置。 而分位数回归估计能精确地描述解释变量对于被解释变量的变化范围以及条件分布形状的影响,能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。 二、分位数回归及其估计 损失函数 定义 在统计学中损失函数是一种衡量损失和错误程度的函数。常常记作 。 损失函数常用形式 对于之前的线性模型来说,就是使得残差平方和最小,即损失函数为平方损失函数,此为最小二乘回归。而如果损失函数为绝对值损失函数,则称为最小一乘回归,它使得残差绝对值的和最小。最小一乘回归是分位数回归的特例。 分位数回归参数估计的思想 分位数回归参数估计的思想 与LR估计量明显不同的QR估计量的特点在于,在QR中数据点到回归线距离的测量通过垂直距离的加权总和(没有平方)而求得,这里赋予拟合线之下的数据点的权重是1-τ,而赋予拟合线之上的数据点的权重则是τ.对于τ的每一个选择,都会产生各自不同的条件分位数的拟合函数,这一任务是为每一个可能的寻找适合的估计量。 分位数回归原理 假设随机变量的分布函数为: Y的 分位数的定义为: 回归分析的基本思想就是使样本值与拟合值之间的距离最短,对于Y的一组随机样本 ,样本均值回归是使误差平方和最小,即 样本中位数回归是使误差绝对值之和最小,即 样本分位数回归是使加权误差绝对值之和最小,即 上式可等价为: 一般的 分位数回归的损失函数为: 其中, 为示性函数,Z是指示关系式。当分位数为0.5时,就是最小一乘回归,即中位数回归。 最小二乘回归和最小一乘回归的损失函数是对称的,而一般的分位数回归的损失函数不是对称的,而是由两条从原点出发的分别位于第一和第二象限的射线组成,它们的斜率之比为 。 现假设因变量Y由k个自变量组成的矩阵X线性表示,对于条件均值函数 ,求解 得参数估计值。 分位数回归是对如上简单形式的扩展: 通过对上式求解得到其参数估计值。 参数意义解释:当其它协变量保持不变时,这一估计差异来自一个连续型协变量的单位增量,或者虚拟变量值从0到1的变化。 正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样,分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化,其中,中位数回归运用的是最小绝对值离差估计(LAD,least absolute deviations estimator)。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。 对一个样本,估计的分位数回归式越多,对被解释变量yt条件分布的理解就越充分。 以一元回归为例,如果用LAD(最小绝对离差和)法估计的中位数回归直线与用OLS法估计的均值回归直线有显著差别,则表明被解释变量yt的分布是非对称的。 如果散点图上侧分位数回归直线之间与下侧分位数回归直线之间相比,相互比较接近,则说明被解释变量yt的分布是

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档