- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
配比设计中缺失数据的hot2deck估算
中国卫生统计2004 年 10 月第 21 卷第 5 期 3·03 ·
配比设计中缺失数据的 hotdeck 估算
1 2 2 1
任金马 赵 杨 陈 峰 蓝绍颖
【提 要】 目的 探讨 hotdeck 估算在含有缺失数据的配比设计资料分析中的应用。方法 在 Stata70 软件上利
用 Adrian Mander 和 David Clayton 开发的 hotdeck 程序进行数据模拟。结果 hotdeck 估算可以使缺失数据所包含的信
息得到一定程度的弥补 ,当含有缺失值的变量是分类或等级变量时 ,效果更为显著。结论 hotdeck 估算是解决配比设计
资料中离散型数据缺失问题的一个有效工具。
【关键词】 缺失值 hotdeck 估算 匹配 近似贝叶斯自举法
在流行病学调查资料中 , 经常会碰到由于失访、无 等于 BB (Bayesian bootstrap) 法。因此, 首先简单介绍
应答或不符合预先规定的条件等原因造成的数据缺失 BB 法。BB 法估算包括两个步骤 :
现象, 严重影响资料的质量和统计分析的结果。在配
比设计的流行病学资料中, 如果某变量有数据缺失, 那
(
么就会影响该配比组的所有数据 包括病例组和对照
)
组 。处理缺失数据的方法较多, 最常用的方法是将含
有缺失数据的个体从统计分析过程中剔除, 称为配对
( )
删除法, 很多统计软件 如 SAS 、SPSS 、Stata 等 自动采
用这种方法。但是这样做我们就会丢失部分信息。为
了解决这个问题 ,统计学家提出了许多估算缺失数据
的方法 ,本文着重探讨 hotdeck 估算在配比设计资料
〔1〕
中的应用 ,并用 Stata70 软件 进行数据模拟分析。
图 1 hotdeck 估算示意图
方法简介
( )
第一步 :随机抽取 n - 1 个 0 , 1 区间内的均匀随
hotdeck 这个名词来源于计算机用语 ,是指用于 机数, 并从小到大排序, 记为 a1 , ……, an - 1 , 同时让
( )
处理数据文件的内存卡 ,其中 hot 是指相同的数据文 a0 = 0 , an = 1 , 这里的 n 是所有观察值 包括缺失值
件 〔2 〕。传统的hotdeck 估算属于简单估算中的一种。 的个数。
文档评论(0)