13 填充算法.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
13 填充算法

稀疏编码的最近邻填充算法* 苏毅娟1 , 程德波2 , 宗 鸣2 , 李凌2 ,朱永华3 广西师范学院,南宁530023;2.广西师范大学计算机科学与信息工程学院,广西桂林 541004 广西大学 计算机与电子信息学院, 南宁530004K-Nearest Neighbor Imputation,简称KNNI)的参数K值固定问题了研究,发现对缺失值填充时,K值固定很大程度上影响填充效果这一重构过程中考虑了样本之间的相关性能分析指标RMSE和相关系数的实验比较结果表明,该算法比KNNI算法的效果要好。该算法能很好的避免KNNI算法的缺陷,适用于预处理缺失值填充应用。缺失值填充RMSE;相关系数 中图分类号:TP181 K Nearest Neighbor Imputation based on Sparse Coding SU Yi-juan1,CHENG De-bo2, ZONG Ming2, LI Ling2 , ZHU Yong-hua3 (1.Guangxi Teachers Education University, Nanning, 530023, Guangxi, China; 2. Guangxi Normal University, Guilin, 541004, Guangxi, China; 3.School of Computer, Electronics and Information, Guangxi University, Nanning, 530004, China) Abstract: Aimed at the parameter K fixed issues of K-Nearest Neighbor Imputation (KNNI) algorithm to research, and found that when imputed the missing values, the fixed value of the parameter K results in a large extent influence of the imputation effect. Therefore, the K Nearest Neighbor based on Sparse Coding (KNNI-SC) algorithm is proposed to solve this problem. This proposed method reconstructed each missing sample with the training samples, in the reconstruction process to fully consider the correlation between samples; and used anorm to learn to ensure each missing samples is imputed by different number of training samples, so solve the parameter K value selection problem of KNNI algorithm. Performance comparison based on the data analysis of the experimental results indicators RMSE and correlation coefficients show that the algorithm is better than KNNI algorithm. The algorithm can well avoid the defects of KNNI algorithm, it is available to data preprocessing step that needs missing values imputation’s applications. Key words: Missing value Imputation; sparse coding; reconstruct; RMSE; correlation coefficient; data preprocessing 0 引言 在数据挖掘和机器学习应用中,经常因一些原因使数据不能获取时完整无缺,造成数据缺失。比如有些信息暂时无法获取,数据被遗漏、不能正常收集的信息、获取某些信息的代价太大等都可能导致数据缺失[1,2]。而且在一些工业领域缺失值的比率高达80%以上[3,4]。数据缺失会影响到从中抽取规则的正

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档