- 272
- 0
- 约1.7千字
- 约 21页
- 2018-05-04 发布于河南
- 举报
缺失数据的插补方法
缺失数据的插补方法 中国科学院系统科学研究所 杨 军 联系方式:tomyj2001@163.com 报告提纲 缺失数据 为什么进行插补 单一插补 多重插补 几何插补 问题与挑战 缺失数据 在许多实际问题的研究中,有一些数据无法获得或缺失。当缺失比例很小时,可直接对完全记录进行数据处理,舍弃缺失记录。 但在实际数据中,往往缺失数据占有相当的比重,尤其是多元数据。这时前述的处理将是低效率的,因为这样做丢失了大量信息,并且会产生偏倚,使不完全观测数据与完全观测数据间产生系统差异。 什么是插补 给每一个缺失数据一 些替代值,如此得到“完全数据集”后,再使用完全数据统计分析方法分析数据并进行统计推断。 80年代以后,人们开始重视数据缺失问题,着力研究插补方法。迄今为 止,提出并发展了30多种的插补方法。在抽样调查中应用的主要是单一插补和多重插补。 为什么进行插补 允许应用标准的完全数据分析方法 能融合数据收集者的知识 数据缺失使数据结构复杂化,需要使用更复杂的统计工具进行分析,而插补可以缓解这一困难 能够防止删除不完全记录造成的信息丢失 在一些情形下,插补能够减少无回答偏倚 特别注意:插补的目的并不是预测单个缺失值,而是预测缺失数据所服从的分布 单一插补 单一插补指对每个缺失值,从其预测分布中取一个值填充缺失值后,使用标准的完全数据分析
您可能关注的文档
最近下载
- 金陵科技学院《工程制图》专转本考试试卷(含答案).pdf VIP
- 医疗机构医用耗材管理规范(国药监械管〔2025〕61号,附解读).docx VIP
- 四年级国测德育模拟试卷.docx VIP
- 4,测定焊缝(通用)探伤仪斜探头折射角和声轴偏斜角.doc VIP
- 腹腔内窥镜手术系统注册审查指导原则 第4部分:风险管理2025.docx VIP
- 卫生健康行业数据分类分级指南(试行).pdf VIP
- JB_T 10088-2016 6kV~1000kV级电力变压器声级.pdf VIP
- 2026全球及中国薄晶圆临时键合设备和材料行业需求动态与前景趋势预测报告.docx
- 美术专业个人简历制作与面试技巧.docx VIP
- 开鲁县污水排放站危废暂存库改造项目环境影响报告表.doc VIP
原创力文档

文档评论(0)