缺失值的处理.docxVIP

  • 25
  • 0
  • 约2.48千字
  • 约 3页
  • 2022-09-01 发布于四川
  • 举报
一、缺失值的类型 缺失值从缺失的分布来讲可以分为完全随机缺失,随机缺失和完全非随机缺失。 完全随机缺失(missing completely at random,MCAR)指的是观看对象的数据缺失完全是由随机因素造成的,独立于已完成的和将 来要进行评价的结果,既不取决于已观看到的数据也不取决于未被观看到的数据。例如由于受试者搬迁而脱落、讨论者未能评估或一 些设计因素而消失缺失。 随机缺失(missing at random,MAR)指的是数据的缺失取决于以观看到的结果,不取决于未观看到的结果。例如在对一个降压药的临 床讨论中,依据方案,当受试者觉察血压掌握并不抱负(舒张压太高)时打算退出讨论。 非随机缺失(missing not at random,MNAR)指的是数据的缺失依靠于不完全变量自身。观看对象的缺失概率与当前尚未观看到的结 果有关。一般通过简单模型解决 二、处理缺失值的方法.忽视缺失值 当缺失的类型属于完全随机缺失时,那么采纳忽视缺失值的方法,即可以剔除缺失样本,采纳完整数据进行分析.数据填补 适用状况:①相对小的缺失率(例如10%?15%);②在临床上或在生物学上,含有缺失值的变量对于所要讨论的问题都具有特别重要 的意义;③有合理的假设和结转技术策略,一般宜遵循保守的原那么;④不同填补方式产生的结论需进行敏感性分析 (1)简洁填补 名称表1常用简单数据填补方法 替代方

文档评论(0)

1亿VIP精品文档

相关文档