- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第29卷第2期 长春师范学院学报(自然科学版) 2010年 4月
V01.29 No.2 JournalofChangehunNormalUniversity(NaturalScience} Apr.2010
NMAR机制下线性回归模型参数的Bayesian估计
孙晓松 ,朱鹏程2
(1.连云港师范高等专科学校数学系,江苏连云港 222006;2.连云港市统计局,江苏连云港 222006)
[摘 要】当数据缺失机制为非随机缺失 (NMAR)时,线性回归模型中的参数估计是一个复杂的问
题 .本文采用贝叶斯 (Bayesian)方法,并利用 MCMC方法、选择模型和Gibbs抽样方法,求得了参数
的Bayesian估计,用一个模拟例子求得参数的估计均值和方差说明了此种方法的可行性。
[关键词]缺失机制;线性模型;选择模型;loslt模型;Gibbs抽样;Bayesian估计
[中图分类号】O212.8 [文献标识码】A [文章编号]1008—178X(2010)02—0015—03
在研究实际问题的过程中,经常会有一些数据无法获取或缺失.目前,插?b(imputation)是处理缺失数据的
常用方法,即给每一个缺失数据一些替代值,如此得到 “完全数据集”后,再使用标准的完全数据统计方法进行
数据分析与统计推断.
20世纪 80年代前后,学者们发展了多种单一插补方法,而单一插补往往会低估估计量的方差,为改善这
一 弊端,Rubin提出了多重插~l,CZ】的方法.经过多年的发展和完善,多重插补得到了广泛应用并在 sAS等统计
软件中采用.多重插补是一种以模拟为基础的方法,对每个缺失值产生多(m1)个合理的插补值,得到 m组
完全数据,使用标准的完全数据方法分析每组数据并融合分析结果得出整体推断.[]常用的多重插补法有回归
预测法、倾向得分法和MCMC方法三种.3【J
本文采用MCMC方法对线性模型中的缺失数据进行插补,从而得到参数的贝叶斯(Bayesian)估计 .
1 缺失机制4【】
若 y中有缺失,此时记 Y=( , )为 rt×l的完全数据矩阵,其中 表示 】,的观测部分, 表示y
的缺失部分.记 R是一个,t×P的指示变量矩阵,若 y的元素观测到,尺的元素取值为 l,若 y的元素缺失,R
的元素取值为0.在缺失机制的研究中考虑概率P(RlY,),是与缺失机制有关的某个未知参数.
若 P(Rl ,y ,)=P(Rl ,),缺失机制是随机缺失(^4L媪);
若 P(RI ,l,,)=P(RI),缺失机制是完全随机缺失(MQ );
可见,MCAR指缺失数据是来 自总体的一个简单随机抽样,缺失机制与 值无关,它是MAR的一种特殊情
况.
若 P(Rl , ,)=P(RI ,)或者就是 P(RI】,, ,)本身,缺失机制是NMAR.
此外,称数据模型参数 和缺失指示变量参数 是可分的,如果知道 不提供 的任何信息,反之亦然.如
果随机缺失和可分性都满足,则称为可忽略的缺失机制,否则称为不可忽略机制.
2 模型介绍
本文讨论线性模型的参数回归问题,首先介绍线性模型的一般表示方法:
Y= +e,E(e)=0,Coy(e)=0.2,. (1)
这里,Y是 7/,×1的观测向量, 为n×P已知矩阵,通常称为设计矩阵且假设 rk()=P.是P×l未知参
数向量,e为,l×1随机误差向量.
当模型(1)中观测变量Y出现缺失时,缺失机制可能有三种,本文主要讨论当缺失机制为NMAR时数据的
处理来求得模型(1)的参数估计.
Heumann(2003)指出,缺失指示变量 和观测y的联合分布可以做如下分解:
【收稿日期】2010—01—08
作【者简介】孙晓松 (1981一),女,江苏连云港人,连云港师范高等专科学校数学系助教,硕士,中级统计师,从事数理统
计研究。
· l5 ·
.
您可能关注的文档
最近下载
- 《年产30万吨轻油裂解气高压深冷分离制取乙烯工艺设计》-毕业设计(论文).doc VIP
- 防火墙(共57张课件).pptx VIP
- 教科版科学六年级上册第一单元《微小世界》测试卷完整版.docx VIP
- 《创新创业实用教程》课件——任务1 创业意识认知.pptx VIP
- 新教材解读及实施课件-统编版道德与法治八年级上册.pptx
- 妇科腹腔镜技术应急预案.pptx VIP
- 水利工程监理工作报告 .pdf VIP
- 工业产品生产单位落实质量安全主体责任知识分享.pptx VIP
- 课本附录单词表+Vocabulary+from+primary+school(小学单词表)2024-2025学年人教版英语七年级上册.xlsx
- 学前儿童家庭与社区教育 课程概述 第一章 家庭与学前儿童家庭教育.ppt VIP
文档评论(0)