基于加权K近邻的高维量表型数据缺失值多重插补研究与应用.pdf

基于加权K近邻的高维量表型数据缺失值多重插补研究与应用.pdf

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

数据质量是从数据中挖掘出准确有效信息的关键因素,然而在实际情况中数

据的缺失不可避免,不合理的缺失值处理会降低下游数据分析结果可信度;缺

失值本身可以根据不同的标准进行不同类型的划分,例如根据缺失值形成的模

式分为单变量缺失与多变量缺失,根据缺失机制分类为完全随机缺失、随机缺

失与非随机缺失,又或是依照数据类型进行划分,拆分为连续数据缺失、离散

数据缺失等等;由于不同的插补算法有各自的偏重,例如矩阵分解法无法对无

序分类数据进行插补,单纯的KNN算法在高维情况插补效果有所下降等等,因

文档评论(0)

dongbuzhihui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档