- 1
- 0
- 约1.04万字
- 约 4页
- 2017-08-19 发布于天津
- 举报
河南省公共卫生服务多项目县2型糖尿病健康管理服务实施效果.pdf
· 318 · 学学报 (医学版) 2012年5月 第47卷 第3期
量的关联程度也被低估 。成组删除法是缺失值处理 据信息。倘若处理方法选择不当,会产生错误的结
最常用 的方法 ,在数据缺失率低的情况下 ,具有一定 论 。因此 ,不管数据处理技术多么先进 ,填补效果多
的优势。EM 法 和 回归法均 适用 于正态分 布 的总 么接近 “真实 ”,依然无法替代 原始信息 ,提示在今
体 ,而原数据库 中各变量均为偏态分布 ,为避免误 后 的工作中,仍要从源头控制 ,牢把质量关 ,将缺失
差 ,该研究以原数据库的均值和标准差为基础 ,运用 数据控制到足以忽略 的地步 ,这将对后期 的数据分
蒙特卡罗数据模拟技术模拟 100次正态分布数据集 析提供坚实的基础。
作为完整数据集 ,并模拟 出不 同缺失率 的随机缺失
参考文献
数据集 ,比较该模 型下 EM法和回归法的填充效果 。
对 于 随机 缺 失 的数 据 集 ,在 缺 失 较 少 时 [1]施学忠 .艾滋病 中医证候 的统计建模研究 [D].郑州 :郑
(10% ~20%),采用 MI法准确度 、精确度高于其他 州大学 ,2008.
方法 ,且 只需较低的填充次数即可达到较好的效果 , [2]茅群霞 .缺失值处理统计方法 的模拟 比较研 究及应用
【D].成都 :四川大学 ,2005.
填充后 的分布接近完整数据集分布 ,并能很好地反
[3]曹阳,张罗漫.运用 SAS对不完整数据集进行 多重填
映完整数据集的准确度 ,其处理结果与 “实际情况”
补——SAS9中的多重填补及其统计分析过程 (一 )
较接近,与殷杰等 的结果一致 。缺失 30%时 ,采
[J].中国卫生统计 ,2004,21(1):56
用成组删除法处理后 的准确度高 ,与完整数据集 的
[4]BarnardJ,MengXL.Applicationsofmuhipleimputationin
均值和分布无差异 ,但是其精确度较差。缺失较 多 medicalstudies:from AIDStoNHANES J『].StarMethods
(缺失率 40%)时 ,所有方法填充效果均不佳 ,说 MedRes,1999,8(1):17
明当缺失数据过多时 ,这些数据在当前 的环境 下已 [5]花琳琳 ,施学忠,杨永利 .不 同缺失值填充技术在 HIV/
经失去了可利用的价值 ,需要探讨更先进 的处理方 AIDS血液样 品检测数据 中的应用 [J].中国卫生统计 ,
法 。该研 究 尚未涉及缺失较少 (缺失率 10%)的 2011(6):668
数据集 ,有待进一步探讨 。 [6]殷杰 ,石锐 .SAS中处理数据集缺失值方法 的对 比研究
[J].计算机应用 ,2007,27(增刊):439
任何一种缺失值处理技术都只是将缺失值补充
(201l一11—09收稿 责任编辑赵秋 民)
为主观估计值 ,不一定完全符合客观事实。在对不
完整数据进行处理时 ,总会或多或少 的改变原始数
doi:10.3969/j.issn.1671—6825.2012.03.012
河南省公共卫生服务多项 目县2型糖尿病健康管理服务实施效果
吴 建¨,张东霞 ,李小芳
1)
您可能关注的文档
最近下载
- 新职业英语职业综合英语2(第三版)VR版Unit+1+PPT课件.pptx VIP
- 2026年部编版新教材语文小学二年级下册全册教案(含教学计划).pdf
- 计算机应用基础教程(Windows10+Office2016)PPT全套完整教学课件.pptx VIP
- 烹饪原理课件.pptx VIP
- 眩晕晕厥意识障碍(共48张PPT).pptx VIP
- 军工科研院所基于组织变革的科技创新体系构建与实施.pptx VIP
- 在学习贯彻党的二十届四中全会精神研讨会上的讲话.doc VIP
- 电缆价格详细计算表.xls VIP
- 生产制造过程管理汇报.pptx VIP
- 部编编人教版四年级下册小学道德与法治全册精品课件PPT.pptx
原创力文档

文档评论(0)