可视数据清洗研究综述.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可视数据清洗研究综述.doc

中图法分类号:TP391 文献标识码:A 文章编号:1006-8961(2014 ) - - 论文引用格式: 可视数据清洗综述 王铭军1, 3,潘巧明1,刘真2,陈为3 1. 丽水学院工程与设计学院,丽水,323000; 2. 杭州电子科技大学,杭州,310018; 3. 浙江大学计算机科学与技术学院,杭州,310058。 摘 要:目的 数据清洗是一个长期存在并困扰人们的问题,随着可视化技术的发展,可视数据清洗必将成为数据清洗的重要方法之一。阐述数据的主要质量问题和可视数据清洗的过程,回顾可视数据清洗的研究现状(包括数据质量问题的来源、分类以及可视数据清洗方法),并根据已有文献总结可视数据清洗面临的主要挑战和机遇。方法 由于数据清洗的方法和策略与具体的数据质量问题相关,因此本文以不同的数据质量问题为线索来归纳和评述可视数据清洗的方法和策略。结果 根据数据质量问题的不同,将可视清洗方法归纳为直接可视清洗、可视缺失数据、可视不确定数据、可视数据转换和数据清洗资源共享等,并依据不同的数据质量问题归纳总结出相应问题所面临的挑战和可进一步研究的方向。结论 对可视数据清洗的归纳、总结和展望,并指出在数据清洗领域中可视数据清洗将会是未来最有前景的研究方向之一。 关键词:数据清洗;可视清洗;可视分析;信息可视化;数据分析 A Survey of Visualization Data Cleaning Wang Mingjun1, 3, Pan Qiaoming1, Liu Zhen2, Cheng Wei3 1. College of Engineering and Design, Lishui University, Lishui, 323000, China; 2. Hangzhou DianZi University, Hangzhou, 310018, China; 3. College of Computer Science and Technology, Zhejiang University, Hangzhou, 310058, China. Abstract: Objective Although data cleaning has been well studied, there are still many problems. With the help of visual interface and visualization, visual data cleaning has become one of the important means of data cleaning. This paper describes existing data quality problems and visual data cleaning process, reviews the state-of-the-art of visual data cleaning (including the sources, categories of data quality issues and visual data cleaning methods), and summarizes the challenges and opportunities of visual data cleaning problems. Method Data cleaning techniques are related to the specific data quality issues, and hence this paper follows different data quality problems to summarize and review previous work on visual data cleaning. Result Depending on the data quality issues, visual cleaning methods are summarized as direct visual cleaning, visual missing data, visual uncertain data, visual data transformation and data cleaning resources sharing, etc. Challenges and further research directions are surveyed corresponding to different data quality issues. Conclusion We introdu

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档