- 3
- 0
- 约5.33万字
- 约 7页
- 2017-09-03 发布于北京
- 举报
计 算 机 系 统 应 用 2017 年 第 26 卷 第 4 期
基于输入样本和主数据的编辑规则挖掘算法①
杨 辉, 于守健, 陈少总
(东华大学 计算机科学与技术学院, 上海 201620)
摘 要: 基于编辑规则和主数据的数据修复技术能自动地、确切地修复不一致数据, 但目前编辑规则的获取主要
依靠专业人员的定义. 为了实现数据清洗全自动化, 数据规则的挖掘技术近年来成为研究热点, 针对条件函数依
赖提出的挖掘算法主要有 CFDMiner, CTANE, FastCFD. 在此基础上, 扩展条件函数依赖(CFD)的定义, 在编辑规
则的定义下提出了一种基于输入样本和主数据的编辑规则挖掘算法, 主要思路是从输入样本中挖掘出 CFD, 然
后根据输入样本与主数据在属性上的定义域相似性求出输入样本在主数据中的对应属性, 从而形成带模式组的
编辑规则, 此算法
您可能关注的文档
- 基于清华山维的城市部件像片库建立.pdf
- 基于情感词典与语义规则的微博情感分析.pdf
- 基于情景分析的ECA规则提取方法研究.pdf
- 基于情景演算的多个智能虚拟人协作行为描述语言.pdf
- 基于区间映射规则的数字直方图处理.pdf
- 基于区域边界规则的Modbus TCP通讯安全防御模型.pdf
- 基于区域的微型足球机器人行为产生方法.pdf
- 基于区域光流法的人体异常行为检测.pdf
- 基于区域生长规则的多传感器漏磁检测信号分割方法.pdf
- 基于趋势概念格的决策规则挖掘.pdf
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
原创力文档

文档评论(0)