- 8
- 0
- 约7.85千字
- 约 5页
- 2017-09-03 发布于北京
- 举报
2011年9月 陕西教育学院学报 Sep.2011
第27卷第3期 Journal of Shaanxi Institute of Education Vo1.27 No.3
基于规则和数据学习的清洗模型研究
石少敏
(陕西教育学院计算机科学与技术系,陕西西安 710061)
摘 要:数据质量在信息管理系统中具有重要意义。然而,由于用户拼写、录入、系统升级等原因导致各种数
据质量问题的出现。数据清洗的目的就是检测出脏数据并修复它们。而当前的清洗工具缺乏灵活性和扩展性,基
于此,本文提出了一个基于规则和数据学习的通用清洗模型。模型实现了动态规则学习和动态数据学习等关键技
术。通过规则匹配和反馈学习过程实现了动态清洗规则最佳选择;通过字段学习和元表学习过程实现了动态数据
的初始化。实验证明,应用该模型保证了动态数据的质量,提高了当前清洗工具的灵活性和扩展性。
关键词:数据清洗;清洗规则;规则反馈;数据质量;数据学习;规则学习
您可能关注的文档
最近下载
- GE巴纳OXYIQ氧量分析仪用户使用手册.PDF
- 三级减速器设计_毕业设计论文.doc VIP
- 生命周期评价方法(life cycle assessment,LCA).pdf
- 2025 八年级上册新文化运动与思想解放潮流课件.pptx
- 农药的使用(全套105页PPT课件).pptx VIP
- 2025版中华民族共同体概论课件第三讲文明初现与中华民族起源(史前时期)第四讲天下秩序与华夏共同体演进(夏商周时期).pptx VIP
- AP宏观经济2005考试真题完整修正版.pdf VIP
- 人教版(2024)新教材七年级数学下册第9章平面直角坐标系中的面积问题【八大题型】(含答案).docx VIP
- 光伏电站组件清洗方案.pdf VIP
- CSS第八章:多媒体技术.pptx VIP
原创力文档

文档评论(0)