2025年云计算与大数据之间的关系 .pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

长风破浪会有时,直挂云帆济沧海。——李白

云计算与大数据之间的关系

云计算,大数据是现下比较火的,两者之间互有关系,一般谈云计算的时候也会提到大

数据。所以说感觉他们又相辅相成不可分割,如果是非技术的人员来讲可能比较难理解说这

两者个之间的相互关系,所以有必要解释一下。

一、大数据时代,众人拾柴火焰高。

当数据量很小的时候,很少的几台机器就能解决。慢慢的当数据量越来越大,最牛的服

务器都解决不了问题的时候,就想怎么办呢?要聚合多台机器的力量,大家齐心协力一起把

这个事搞定,众人拾柴火焰高。

对于数据的收集,对于IoT来讲,外面部署这成千上万的检测设备,将大量的温度,适

度,监控,电力等等数据统统收集上来,对于互联网网页的搜索引擎来讲,需要将整个互联

网所有的网页都下载下来,这显然一台机器做不到,需要多台机器组成网络爬虫系统,每台

机器下载一部分,同时工作,才能在有限的时间内,将海量的网页下载完毕。

对于数据的传输,一个内存里面的队列肯定会被大量的数据挤爆掉,于是就产生了基于

硬盘的分布式队列,这样队列可以多台机器同时传输,随你数据量多大,只要我的队列足够

多,管道足够粗,就能够撑得住。

对于数据的存储,一台机器的文件系统肯定是放不下了,所以需要一个很大的分布式文

件系统来做这件事情,把多台机器的硬盘打成一块大的文件系统。

再如数据的分析,可能需要对大量的数据做分解,统计,汇总,一台机器肯定搞不定,

处理到猴年马月也分析不完,于是就有分布式计算的方法,将大量的数据分成小份,每台机

器处理一小份,多台机器并行处理,很快就能算完。例如著名的Terasort对1个TB的数

据排序,相当于1000G,如果单机处理,怎么也要几个小时,但是并行处理209秒就完成

了。

为天地立心,为生民立命,为往圣继绝学,为万世开太平。——张载

所以说大数据平台,什么叫做大数据,说白了就是一台机器干不完,大家一起干。随着

数据量越来越大,很多不大的公司都需要处理相当多的数据,这些小公司没有这么多机器可

怎么办呢?

二、大数据需要云计算,云计算需要大数据。

说到这里,大家想起云计算了吧。当想要干这些活的时候,需要好多好多的机器一块做,

真的是想什么时候要,想要多少就要多少。例如大数据分析公司的财务情况,可能一周分析

一次,如果要把这一百台机器或者一千台机器都在那放着,一周用一次对吧,非常浪费。那

能不能需要计算的时候,把这一千台机器拿出来,然后不算的时候,这一千台机器可以去干

别的事情。谁能做这个事儿呢?只有云计算,可以为大数据的运算提供资源层的灵活性。而

云计算也会部署大数据放到它的PaaS平台上,作为一个非常非常重要的通用应用。因为大

数据平台能够使得多台机器一起干一个事儿,这个东西不是一般人能开发出来的,也不是一

般人玩得转的,怎么也得雇个几十上百号人才能把这个玩起来,所以说就像数据库一样,其

实还是需要有一帮专业的人来玩这个东西。现在公有云上基本上都会有大数据的解决方案了,

一个小公司我需要大数据平台的时候,不需要采购一千台机器,只要到公有云上一点,这一

千台机器都出来了,并且上面已经部署好了的大数据平台,只要把数据放进去算就可以了。

云计算需要大数据,大数据需要云计算,两个人就这样结合了。

山东数联位于济南高新区大数据产业基地,是一家专注大数据人才职业培训的公司。教

学内容包含:大数据开发工程师、大数据架构师、大数据挖掘工程师、ETL开发工程师、SPARK

开发工程师、大数据管理、数据可视化、Hadoop、SAS/SPSS等相关课程。欢迎您的加入

~

文档评论(0)

188****6982 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档