缺失值的处理.docxVIP

下载本文档

25
0
约2.48千字
约 3页
2022-09-01 发布于四川
举报

缺失值的处理.docx

一、缺失值的类型缺失值从缺失的分布来讲可以分为完全随机缺失，随机缺失和完全非随机缺失。完全随机缺失(missing completely at random,MCAR)指的是观看对象的数据缺失完全是由随机因素造成的，独立于已完成的和将来要进行评价的结果，既不取决于已观看到的数据也不取决于未被观看到的数据。例如由于受试者搬迁而脱落、讨论者未能评估或一些设计因素而消失缺失。随机缺失(missing at random,MAR)指的是数据的缺失取决于以观看到的结果，不取决于未观看到的结果。例如在对一个降压药的临床讨论中，依据方案，当受试者觉察血压掌握并不抱负(舒张压太高)时打算退出讨论。非随机缺失(missing not at random,MNAR)指的是数据的缺失依靠于不完全变量自身。观看对象的缺失概率与当前尚未观看到的结果有关。一般通过简单模型解决二、处理缺失值的方法.忽视缺失值当缺失的类型属于完全随机缺失时，那么采纳忽视缺失值的方法，即可以剔除缺失样本，采纳完整数据进行分析.数据填补适用状况：①相对小的缺失率(例如10%?15%)；②在临床上或在生物学上，含有缺失值的变量对于所要讨论的问题都具有特别重要的意义；③有合理的假设和结转技术策略，一般宜遵循保守的原那么；④不同填补方式产生的结论需进行敏感性分析 (1)简洁填补名称表1常用简单数据填补方法替代方

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

缺失值的处理.docxVIP