基于云计算大数据处理技术研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于云计算大数据处理技术研究

基于云计算大数据处理技术研究   摘 要:在信息技术不断发展的今天,各类信息泛滥,人们每天的生活、工作都会接触到海量数据,已然进入了大数据时代。对于海量数据信息,如果采用传统的数据处理办法,很难保证数据信息传输的安全性、快速性。云计算的出现为大数据存储、传输提供了便利,也为数据处理提供了重要保障。文中首先对大数据与云计算之间的关系进行分析,然后探讨了云计算及其关键技术,最后提出云计算背景下的大数据处理技术,希望能够为相关人员提供参考。   关键词:云计算;大数据;处理技术;海量数据   中图分类号:TP274 文献标识码:A 文章编号:2095-1302(2017)06-00-02   0 引 言   在计算机网络技术、通信技术不断发展的今天,人们获取信息资源的渠道更多,信息传播的形式也更加多元化、便捷化,将现阶段称之为信息大爆炸时代也不为过。此外,在信息传播过程中,对数据处理体系提出了更高的要求。据预测,到2020年,世界数据量会超过35亿GB,而针对大数据随机性、庞大性、离散性、爆发性的特点,还需要选择更加强大的数据处理技术。云计算的出现为数据处理革新提供了基础,基于此,加强对云计算背景下大数据处理技术的研究具有十分现实的意义。   1 大数据和云计算之间的关系   云计算技术指采用集中式远程计算资源池,按照需求进行分配,为终端用户提供计算服务技术,且这种服务成本低、效果好。云计算属于数据处理方式,具有以下技术特点:   (1)透明性。从物理角度分析,资源池对所有终端用户都是透明的;   (2)云计算能够为任何行业提供无限能力的计算机服务;   (3)快捷性。云计算能够根据终端用户的要求为其订制服务,同时服务技术具有很强的伸缩能力;   (4)云计算数据在获取方面较为简单,能够促进资源共享,且成本较低。   现阶段,云计算是最为强大的数据处理、运用、存储平台,是大数据处理的首选技术。云计算能够为大数据提供的存储空间、处理能力是无限的,可满足超级容量数据的存储及传输,而这也是传统数据处理技术无法实现的。此外,云计算相对于其他技术更侧重计算与处理,即云计算是大数据处理的工具,而大数据是处理的对象。   2 云计算及其关键技术概述   在并行技术、分布式计算及网格计算等基础上,云计算技术的形成与发展可通过网络连接技术,集中数据计算、存储等功能,构建能够为用户提供无限服务的资源池。   2.1 数据存储技术   信息存储的安全性、数据读写的高效性是保证云计算技术实施的基础,利用分布式存储技术将海量数据存储于服务器集群中,还能够实现对数据的备份处理,提高数据的安全性。此外,通过数据加密技术、冗余存储模式等,可有效避免数据信息泄漏或遭到威胁。其中,Hadoop团队开发的GFS与Google非开源的GFS都是在云计算系统中被广泛运用的存储系统。   2.2 数据管理技术   云计算能够通过分布式处理及分析为用户提供高效服务,但对数据管理技术的管理能力有较高的要求。其中,开源数据管理模块HBase以及BigTable数据管理技术是现阶段主要的数据管理技术。云服务平台管理如图1所示。   2.3 虚拟化技术   虚拟化技术是云计算系统中存储、计算的基础,主要通过相关方式将真实环境中的计算机系统、组件等转移到虚拟环境中,然后结合操作系统、硬件资源、软件应用程序等组成虚拟化层结构。一般虚拟层可以分为上中下三层,通过中间层连接上下两层结构,为其提供类似的功能,保证其运行在虚拟化环境中。虚拟化技术的运用能够实现对相关系统功能的整合,保证资源利用的最大化。   3 云计算背景下大数据处理技术   传统数据管理以收集、存储为主,而云计算背景下,大数据管理方式得到了改变与创新,侧重点在于数据的分析、挖掘,为相关人员决策提供依据。   3.1 大数据采集技术   根据采集形式的不同,可将大数据采集分为两类,即集中式采集与分布式采集。这两种采集方式各具优劣,我们以优点为例进行说明。集中式采集能够掌控全局数据,而在灵活性方面,采用分布式采集模式的优势更为明显。在大数据采集过程中,既包括对企业内部数据的采集,也包括采集企业之间的信息数据,通过分布式并行计算模式,将几种采集模式混合使用,提升数据采集的整体效率。即在大数据采集过程中,对于企业内部采用集中采集模式,而企业之间采用分布式采集模式。在每一个企业内部都设置多个中心服务器,将企业共享的信息数据进行存储。对于中心服务器间的组织则采用分布式数据采集模式。   根据结构类型的不同,可将大数据分为结构化数据、半结构大数据及非结构化数据。在数据采集过程中,应该先对数据类型进行分析,根据不同类型,通过云计算的扩展、容错等优势,实现对数据的同构化,实现各结构数据对接。

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档