- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
!有人预言说未来将会是三分技术,七分数据,得数据者得天下。。。大数据的介绍全文共19页,当前为第1页。!Big Data, it’s more than what you think 大数据,是当今公众津津乐道的一个热词,人们纷纷在探讨大数据所带来的科技进步及所蕴含的巨大价值,甚至有人把大数据形容为未来世界的石油,更有人夸张的宣称掌握了大数据的人,就可以像上帝一样来俯瞰整个世界。大数据的介绍全文共19页,当前为第2页。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。近几年,被热炒的大数据,不只是指资料,也指这些用来分析、处理巨量资料的新兴科技。 2013年马云卸任阿里集团CEO的职位时曾说,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。大数据的介绍全文共19页,当前为第3页。 这个世界的数据到底有多少你想像不到。。。大数据的介绍全文共19页,当前为第4页。 近年来,全球数据存储量呈现爆炸式增长,美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,目前世界上90%以上的数据是最近几年才产生的。据中为咨询预测,到2020年,全球数据量将达到35ZB(相当约90亿块4TB硬盘容量)。 根据国际数据公司(IDC)的测算,似乎没有足够的磁盘空间存储。就传统IT 企业来看,其结构化和非结构化的数据增长也是惊人的。2005年企业存储的结构化数据为4EB,到2015年将增至29EB,年复合增长率逾20%。非结构化数据发展更猛。2005年为22EB,2015年将增至1600EB,年复合增长率约60%,远远快于摩尔定律。大数据的介绍全文共19页,当前为第5页。1Byte = 8 Bit?1 KB = 1,024 Bytes?1 MB = 1,024 KB = 1,048,576 Bytes?1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes?1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes?1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes?1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes?1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes?1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes?大数据的介绍全文共19页,当前为第6页。那么,庞大的数据到底来自哪里呢????!!大数据的介绍全文共19页,当前为第7页。 据统计,国家图书馆的藏书量有2600万册,如果从数据来看的话,一个家庭一年产生的数据相当于半个国家图书馆的数据总量。 而大数据并非现在才出现,比如在古代的人口普查,中国在东汉时期就有几千万人,这显然也是庞大数据。大数据并不是什么崭新的概念,好几十年前 CERN 的科学家就在处理每秒上看 PB (Peta Bytes)巨量资料。那为什么一直到近几年「大数据」这颗塬子弹才爆发呢。 现今要处理的资料量更庞大、资料产生跟处理速度更惊人、资料来源更多样,于是处理、储存大量资料的新技术跟工具快速发展,像是开源软体 Hadoop 跟 NoSQL 资料库。新科技诞生后,开发者跟使用者需要一个专业名词来与之前的科技作出区别,于是「大数据」一词因应而生。大数据的介绍全文共19页,当前为第8页。 大数据的特点 Volume(大量)Velocity(高速)Variety(多样)veracity(真实性) 数据量大、数据种类多、 要求实时性强、数据所蕴藏的价值大。在各行各业均存在大数据,但是众多的信息和咨询是纷繁复杂的,我们需要搜索、处理、分析、归纳、总结其深层次的规律。最后是价值,从大量的低质量、低价值的数据中获取知识,犹如从大海中捞针,获取数据成本很高,但有待挖掘价值大。 大数据的挖掘和处理。 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对/lemma/ShowInnerLink.htm?lemmaId=8999032ss_c=ssc.citiao.link海量数据进行分布式数据挖掘(SaaS),但它必须依托云计算的/lemma/ShowInnerLink.htm?l
您可能关注的文档
最近下载
- 玉米保护性耕作水肥一体种植技术规程.pdf VIP
- DB2203_T 6-2023 玉米秸杆覆盖条耕滴灌水肥一体化技术规程.pdf VIP
- J16J156 被动式低能起居住建筑节能构造.docx VIP
- 车辆租赁服务项目实施方案及保证措施.docx VIP
- ISO1940-1机械振动-恒定(刚性)状态下转子的平衡质量要求第1部分:平衡公差的规定和验证.pdf VIP
- J10J123 住宅厨房卫生间ZDA防火型排气道.docx VIP
- J12Z605 混凝土排水管道基础与接口.docx VIP
- J14J141 聚苯暖砖现浇混凝土填芯墙体构造.docx VIP
- J14J144 WG建筑刚性防水与混凝土抗震构造.docx VIP
- 肿瘤患者的饮食指导.ppt VIP
文档评论(0)