缺失值处理剖析.docxVIP

  • 67
  • 0
  • 约 26页
  • 2017-03-21 发布于湖北
  • 举报
缺失值1. is.na 确实值位置判断注意: 缺失值被认为是不可比较的,即便是与缺失值自身的比较。这意味着无法使用比较运算符来检测缺失值是否存在。例如,逻辑测试myvar == NA的结果永远不会为TRUE。作为替代,你只能使用处理缺失值的函数(如本节中所述的那些)来识别出R数据对象中的缺失值。2. na.omit() 删除不完整观测manyNAslibrary(DMwR)manyNAs(data, nORp = 0.2) Argumentsdata A data frame with the data set.nORp A number controlling when a row is considered to have too many NA values (defaults to 0.2, i.e. 20% of the columns). If no rows satisfy the constraint indicated by the user, a warning is generated. 按照比例判断缺失.3. knnImputation K近邻填补library(DMwR)knnImputation(data, k = 10, scale = T, meth = weighAvg, distData = NULL)12ArgumentsArgumentsda

文档评论(0)

1亿VIP精品文档

相关文档