数据质量和数据清洗研究.pdfVIP

  • 25
  • 0
  • 约2.13万字
  • 约 7页
  • 2015-09-22 发布于重庆
  • 举报
数据质量和数据清洗研究.pdf

1000-9825/2002/13(11)2076-07 ©2002 Journal of Software 软 件 学 报 Vol.13, No.11 数据质量和数据清洗研究综述 郭志懋, 周傲英 (复旦大学 计算机科学与工程系,上海 200433); (复旦大学 智能信息处理开放实验室,上海 200433) E-mail: zmguo@ 摘要: 对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清 洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结 合情况,分析了几种数据清洗框架.最后对将来数据清洗领域的研究问题作了展望. 关 键 词: 数据质量;数据清洗;数据集成;相似重复记录;数据清洗框架 中图法分类号: TP311 文献标识码: A 在当今时代,企业信息化的要求越来越迫切,其中一个很重要的方面就是企业数据的管理.根据“进去的是 垃圾, 出来的也是垃圾(garbage in, garbage out)”这条原理,为了支持正确决策,就要求所管理的数据可靠,没有错 误,准确

文档评论(0)

1亿VIP精品文档

相关文档