基于输入样本和主数据的编辑规则挖掘算法.pdfVIP

  • 3
  • 0
  • 约5.33万字
  • 约 7页
  • 2017-09-03 发布于北京
  • 举报

基于输入样本和主数据的编辑规则挖掘算法.pdf

计 算 机 系 统 应 用 2017 年 第 26 卷 第 4 期 基于输入样本和主数据的编辑规则挖掘算法① 杨 辉, 于守健, 陈少总 (东华大学 计算机科学与技术学院, 上海 201620) 摘 要: 基于编辑规则和主数据的数据修复技术能自动地、确切地修复不一致数据, 但目前编辑规则的获取主要 依靠专业人员的定义. 为了实现数据清洗全自动化, 数据规则的挖掘技术近年来成为研究热点, 针对条件函数依 赖提出的挖掘算法主要有 CFDMiner, CTANE, FastCFD. 在此基础上, 扩展条件函数依赖(CFD)的定义, 在编辑规 则的定义下提出了一种基于输入样本和主数据的编辑规则挖掘算法, 主要思路是从输入样本中挖掘出 CFD, 然 后根据输入样本与主数据在属性上的定义域相似性求出输入样本在主数据中的对应属性, 从而形成带模式组的 编辑规则, 此算法

文档评论(0)

1亿VIP精品文档

相关文档