任意缺失模式缺失数据不同填补方法效果比较.pdf

任意缺失模式缺失数据不同填补方法效果比较.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
任意缺失模式缺失数据不同填补方法效果比较.pdf

生国里生缠盐垫!!生!Q旦笠!Q鲞筮!翅 任意缺失模式缺失数据不同填补方法效果比较术 张桥1 李 宁2 张秋菊1 刘美娜1△ 【提要】 目的探讨任意缺失模式下缺失数据的填补方法,并对不同方法填补效果进行比较和评价。方法结合 我国北方绝经期妇女钙需要和膳食评估应用研究课题的数据,调用SAS软件中IML模块产生任意缺失模式模拟数据,通 过MI和MIANALYZE过程实现缺失数据的填补,同时应用准确度和稳定度两个评价指标来评价各方法填补的效果。结 果Ps方法填补3次在本文模拟的任意缺失模式的缺失数据中填补效果最佳,MCMC方法填补效果并不理想。结论 法把数据填补成单调缺失后,再用相同方法进行一次填补也是一种可选择的填补方法。 【关键词】 缺失数据任意缺失模式多重填补数据模拟 数据缺失是实验研究和调查研究中一个普遍存在 已观察到的数据无关也与未观察到的数据无关,则该 的问题…,如何正确的处理、分析所缺失的数据在数 缺失数据类型为MCAR;如果缺失数据的发生概率与 据分析中占有重要地位。缺失数据的类型按照不同的 所观察到的变量是有关的,而与未观察到的数据特征 分类方法可划分不同类别,按缺失机制分类和按缺失 无关,则该缺失数据类型为MAR;若数据既不属于完 模式分类两种划分方法心’31。 全随机缺失也不属于随机缺失,那么该缺失数据类型 按照由Little和Rubin在1976年提出的缺失机制就属于NMAR【5J。按照数据缺失模式可以分为单调 com— 缺失模式和任意缺失模式两类哺。7],为了简单明了可 分类,缺失数据可以分为完全随机缺失(missing at atran— random,MCAR)、随机缺失(missing以通过图1来形象的理解,其中是5个变量,1~5是5 pletely at 个样本,“×”表示数据能观察到,“.”表示数据缺失。 dom,MAR)和非随机缺失(notmissingrandom, NMAR)三类H】。如果所缺失的数据发生的概率既与 ‘ ’ ‘ 5 × × (b)任意缺失模式 (a1单调缺失模式 图1数据缺失模式 单调缺失模式如图1(a)所示,对数据集进行适当填补(mul卸le chainmonte 的行列变换后,可以得到这样一个矩阵,它呈现出一种 洛(markov observa- 层级缺失的模式,矩阵中的元素y,缺失时,则对任意 向数据有时也采用单一填补中的LOCF(1ast carded 的P≥,,元素Y,也是缺失的;任意缺失模式如图1(b)tionforward)方法㈨。本文将探讨AdHoc法、 所示,数据缺失具有随意性,没有任何规律可循,即使LOCF填补、多重填补中的回归方法、预测均数匹配 通过行列变换也无法看出任何规律。 mean (predictive 对于任意缺失模式的数据处理,查阅相关文献发 (propensity 现常用的就是把

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档