大数据的技术构成.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在大数据概念中,目前还没有哪项单一技术能够满足所有应用需求。这些大数据技术或 针对数字营销数据进行优化,或分析社交网络数据,再或者主要用已知数据来预防未知的风 险,其应用领域比较具有针对性。 我们可以将一套完整的大数据平台拆分成几个不同的技术领域。从宏观上来看,大数据 平台包含了三个重要的技术部分。 首先是数据交易技术。这一部分技术所从事的工作,是对一些传统的关系型数据或者非 结构化数据进行处理,这些数据包括ERP应用、数据仓库应用、在线交易处理 (OLTP)等。 数据交互是第二类组成部分,其也是成长最迅速的一类大数据技术。数据交互技术主要 是对社交网络、物联网设备和传感器、地理定位、影像文件、互联网点击、电子邮件等应用 产生的数据进行处理。 最后是对数据的处理。在这一部分中,包含了技术架构、计算方式等内容。知名的Hadoop 平台就是其中的一份子。 另一方面,从微观层面,我们可以将大数据平台再进行更加细致的剖析。 1.数据存储数据存储是大数据平台的根本,也是所有大数据技术中产品种类最多的一个 组成部分。没有了存储平台,数据也就没有了载体。在数据存储的组成中,包括了高性能的 内核式分布存储系统、用户级的分布式存储以及业务级别的数据存储。这其中不乏LustreFS、 HadoopHDFS这样的知名产品。 2.数据同步这一部分技术主要用于将基础架构产生的数据内容进行转换,以完成数据处 理、系统监控等方面的操作。 3.数据开发顾名思义,数据开发技术主要承担了搭建大数据平台上层建筑的任务。其中 涵盖了用户认证、数据鉴权、工作流、数据管理等多方面的任务。4.数据呈现数据可视化是 这一部分的一个重要主题。 Facebook 为了更好地应用大数据技术,特别开发了名为 FacebookInsights的产品,将大数据平台中的单元和属性抽离出来,以更好地掌控数据资源。 5.数据计算这一部分毫无疑问是一个大数据平台最为重要的技术核心。其承担了对海量 数据进行再加工再处理的任务。一般来说,我们可以将其分为离线计算与实时计算两种模式。 离线计算一般适用于对时间属性不敏感的应用,相对而言,其技术开发和构建的成本较低。 但是由于离线计算需要数据同步技术对数据进行采集,过大的数据量会使得采集过程失败, 因此目前用于离线计算的数据量还不能太大。 相较于离线计算,实时计算处理速度更快,但是其成本很高。目前实时计算大都用于金 融、互联网等行业。 6.数据挖掘数据挖掘并不是一个新的技术,目前其发展已经非常成熟。在大数据的概念 下,数据挖掘被赋予了新的意义。其所处理的数据类别越来越广泛,同时为了迎接海量数据, 数据挖掘工具的性能也在不断提升。 在当今这个飞速发展的数字时代,大数据已经成为我们生活中必不可少的一部分。展望 未来,围绕大数据还将有一些新的技术和商业模式诞生。数据将成为如同服装、汽车、家电 或者是食物一样的商品,成为人们选购的对象。同时,精通大数据相关技术的数据科学家, 也会成为一个新兴的职业类型,在新时代中扮演重要的角色。 为什么需要大数据? 在当今IT业界中大数据是炙手可热的一个名词,其以简单的语法构成通俗易懂地诠释 了什么才是庞大和复杂的数据集。大数据之所以会如此流行,是因为其契合了IT业界的发 展与应用趋势。 最为广泛流传的对大数据的解释莫过于4个V——海量的数据规模(Volume)、快速的 数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)和巨大的数据价值(Value), 而这恰恰是当前社会对数据的需求组成。(为了更好地发展业务,一直以来企业、组织和机 宁美国度 构都在对结构化数据进行梳理和统计。 不过随着IT应用在业务中的逐渐深入,决策者们发现他们需要收集的数据不仅存在于 销售年报这样的传统信息中,而且还同样存在于网络日志、传感器网络、社交网络、影音文 件、互联网搜索索引、详细通话记录、医疗记录、摄影档案、视频档案以及电子商务等内容 之中。 这些内容有着多种多样的载体和类型,数据增长和迭代速度极快,相互之间还会存在不 同的关联。最终,会积累下非常庞大的体量。近两年吸引了大量投资的视频监控领域,就是 大数据内容的一个重要应用实例。其不仅拥有较大的数据规模,产生速度惊人,同时非结构 化的数据组成使得很难利用传统IT技术对其进行处理。不过,由于其与日常生活、工作的

文档评论(0)

137****4633 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档