基于r软件的缺失数据mice填补效果研究-中国卫生统计.pdfVIP

  • 56
  • 0
  • 约2.32万字
  • 约 5页
  • 2018-08-19 发布于天津
  • 举报

基于r软件的缺失数据mice填补效果研究-中国卫生统计.pdf

基于r软件的缺失数据mice填补效果研究-中国卫生统计

·580· 中国卫生统计2015年8月第32卷第4期 基于R软件的缺失数据MICE填补效果研究 山东大学公共卫生学院流行病与卫生统计学系(250012) 章 涛 朱 麟 季加东 袁中尚 薛付忠 李秀君△   【提 要】 目的 研究不同缺失率、不同缺失机制下,MICE(multivariateimputationbychainedequations)多重填补的 效果,探讨该填补方法的适用情况。方法 依托某现况调查的完全数据,使用R软件构造不同缺失率、不同缺失机制的缺 失数据。计算列表删除和MICE多重填补后分析结果的标准偏倚,并进行比较。单独对分类变量计算多重填补后的平均 错分率。结果 在单变量缺失率分别为10%、20%和30%的随机缺失三种情况下,MICE多重填补表现优良;其他模拟情 况下,MICE多重填补相比于列表删除并未表现出明显的优势。对于分类变量,MICE填补后的平均错分率均超过60%。 结论 对于随机缺失数据,且单变量缺失率不超过30%时,建议采用MICE多重填补进行处理;但对于资料中的分类变 量,不建议直接引用MICE填补后的具体数值。 【关键词】 MICE 缺失数据 模拟研究 多重填补 AStudyonEffectsofMultivariateImputationbyChainedEquationBasedon RSoftware ZhangTao,ZhuLin,JiJiadong,etal.(DepartmentofEpidemiologyandHealthStatistics,SchoolofPublicHealth,ShandongU niversity(250012)) 【Abstract】 Objective Toevaluatetheeffectsofmultivariateimputationbychainedequations(MICE)fordatawithdif ferentmissingmechanismsandvariousmissingproportions,andexploretheapplicationsituationsofthismethod.Methods A completedatasetfromacrosssectionalstudywasusedtosimulatemissingdatasetswithdifferentmissingmechanismsandvari ousmissingproportionsbyRsoftwareThestandardbiasoftheincompletedatasetsobtainedbylistwisedeletionwascompared withthatoftheimputeddatasetsobtainedbyMICEAdditionally,forbinomialvariable,theaveragemisclassificationratiowas calculated.Results  MICEperformedwellfor“missingatrandom”datawiththeunivariatemissingproportionof10%,20% and30%Inotherscenarios,MICEfailedtoshowadvantageoverlistwisedeletionForbinomialvariable,theaveragemisclassi ficationratiosweremorethan60%Conclusion Whenthedatawasmissingatrandomandtheunivariatemissingproportion wasnomorethan30%,MICEwasrecommendedtouse,buttheimputedvalueinbinomialvariablewasnotsuggestedtobere presentedinrawdatadirectly 【Keywords】 MICE;Missingdata;Simulation;Multipleimputation   缺失数据(missingdata)是指那些未被观察到的、 多重填补的方

文档评论(0)

1亿VIP精品文档

相关文档