大数据处理流程中的数据质量影响分析.docVIP

大数据处理流程中的数据质量影响分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据解决流程中的数据质量影响分析 作者:莫祖英 来源:《当代情报》第03期 ????〔摘要〕大数据的规模性、高速性和数据来源的多样性,使数据更可能产生不一致和冲突,这会造成大数据质量问题。本文在界定大数据质量内涵及其维度的基础上,分析大数据解决流程中数据收集、数据预解决、数据存储、数据解决与分析、数据可视化及应用等环节对大数据质量的影响及核心因素,构建大数据流程的质量影响模型,并提出大数据质量保障的建议与方法。 ????〔核心词〕数据质量;大数据流程;质量影响模型;影响因素 ????DOI:10.3969/j.issn.1008-0821..03.013 ????〔中图分类号〕G203〔文献标记码〕A〔文章编号〕1008-0821()03-0069-04 ????〔Abstract〕The large scale,high-speed and diversity of data sources in big data,make it more likely to have inconsistency and conflict,which lead to quality issues of big data.In this article,the paper defined connotation of big data quality and its dimensions,and then analyzed the influence that data collection,data preprocessing,data storage,data processing and analysis,data visualization and its application in the procedure of big data processing exerted on big data quality and key factors;finally,the paper constructed a quality influencing model in big data process,and put forwards suggestions on quality assurance of big data. ????〔Key words〕data quality;big data process;quality influencing model;influence factors ????大数据时代,强调对总体数据的解决与分析,关注事物之间的有关关系,以及对发展趋势的分析预测。大数据的规模性、高速性和数据来源及形式上的多样性,使数据更可能产生不一致和冲突,这些都会造成大数据质量问题,因此需要对大数据进行质量管理。大数据重要由社交网络、移动计算、监控设备和传感器等信息源产生,涉及顾客多媒体服务数据、服务系统监控与管理数据、顾客行为数据、服务市场环境和客户关系数据等。大数据的来源复杂性和类型多样性造成价值密度低、提取难度大等特点,同时也给大数据质量管理带来了困扰。 ????在大数据质量的有关研究中,宗威等[1]在分析大数据特点的基础上,提出了大数据环境下数据质量的重要性及其挑战,并分别从大数据流程、大数据技术和大数据管理3个视角提出如何确保大数据质量,特别在大数据流程方面,重要从数据收集、存储和使用3个阶段提出了质量确保的建议。胡雄伟等[2]提出大数据中的数据质量问题涉及数据收集、使用、公布的整个过程,贯穿数据管理工作的始终,并分析了美国颁布的《数据质量法》中的3个数据质量原则——数据质量原则、质量管理流程和数据质量救助机制。Vijay Khatri等[3]设计了大数据治理的5个决策领域,涉及数据准则、数据质量、元数据、数据访问和数据生命周期。Sharma等[4]提出有效的数据资产管理,必须涉及元数据管理(Meta Data)、数据质量(Data Quality)、数据原则、数据架构、数据权限(Right)、数据安全性(Safety)、数据生命周期(Data Lifecycle)、主数据管理(Master Data Management)等各个方面。王宇德[5]提出运用信息架构原则和实践,实现大数据与公司数据的灵活集成,达成大数据治理的目的。其中大数据信息架构的重要原则是通过价值、成本和风险透镜将数据视为资产,并确保数据的时效性、质量和精确性;由于大数据的质量和精确性规定存在巨大差别,需要对其进行适宜的取舍以满足实际需求。马晓亭[6]以图书馆大数据为研究对象,提出为确保图书馆大数据的价值分析与服务质量,需进行大数据质量管理,如管理员从全局层面挖掘数据间的有关关系,加强对读者阅读行为、阅读关系和阅读社交舆情等大数据资源的质

文档评论(0)

132****5705 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5104323331000004

1亿VIP精品文档

相关文档