- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据的本质解析
本文来自:5联网 /
如果仅仅是海量的结构性数据,那么解决的办法就比较的单一,用户通过购买更多的存
储设备,提高存储设备的效率等解决此类问题。然而,当人们发现数据库中的数据可以分为
三种类型:结构性数据、非结构性数据以及半结构性数据等复杂情况时,问题似乎就没有那
么简单了。
大数据汹涌来袭
当类型复杂的数据汹涌袭来,那么对于用户IT系统的冲击又会是另外一种处理方式。
很多业内专家和第三方调查机构通过一些市场调查数据发现,大数据时代即将到来。有调查
发现,这些复杂数据中有85%的数据属于广泛存在于社交网络、物联网、电子商务等之中
的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的
渠道和技术的不断涌现和应用。
如今大数据的概念也存在着很多的炒作和大量的不确定性。为此,编者详细向一些业内
专家详细了解有关方面的问题,请他们谈一谈,大数据是什么和不是什么,以及如何应对大
数据等问题,将系列文章的形式与网友见面。
有人将多TB数据集也称作大数据。据市场研究公司统计,数据使用预计将增长44
倍,全球数据使用量将达到大约35.2ZB(1ZB=10 亿TB)。然而,单个数据集的文件尺
寸也将增加,导致对更大处理能力的需求以便分析和理解这些数据集。
1000多个客户在其阵列中使用1PB(千兆兆)以上的数据数据,这个数字到2020年
将增长到10万。一些客户在一两年内还将开始使用数千倍多的数据,1EB(1艾字节 =10
亿GB)或者更多的数据。
对大企业而言,大数据的兴起部分是因为计算能力可用更低的成本获得,且各类系统如
今已能够执行多任务处理。其次,内存的成本也在直线下降,企业可以在内存中处理比以往
更多的数据,另外是把计算机聚合成服务器集群越来越简单。这三大因素的结合便催生了大
数据。同时,某项技术要想成为大数据技术,首先必须是成本可承受的,其次是必须满足IBM
所描述的三个V判据中的两个:多样性(variet )、体量(volume)和速度(velocit )。
多样性是指,数据应包含结构化的和非结构化的数据。
体量是指聚合在一起供分析的数据量必须是非常庞大的。
而速度则是指数据处理的速度必须很快。
大数据并非总是说有数百个TB才算得上。根据实际使用情况,有时候数百个GB的数
据也可称为大数据,这主要要看它的第三个维度,也就是速度或者时间维度。
全球信息量正在以59%以上的年增长率增长,而量是在管理数据、业务方面的显著挑
战,IT领袖必须侧重在信息量、种类和速度上。
量:企业系统内部的数据量的增加是由交易量、其它传统数据类型和新的数据类型引发
的。过多的量是一个存储的问题,但过多的数据也是一个大量分析的问题。
种类:IT领袖在将大量的交易信息转化为决策上一直存在困扰 - 现在有更多类型的信
息需要分析 - 主要来自社交媒体和移动(情景感知)。种类包括表格数据(数据库)、分
层数据、文件、电子邮件、计量数据、视频、静态图像、音频、股票行情数据、金融交易和
其它更多种类。
速度:这涉及到数据流、结构化记录的创建,以及访问和交付的可用性。速度意味着正
在被生成的数据有多快和数据必须被多快地处理以满足需求。
虽然大数据是一个重大问题,真正的问题是让大数据更有意义,在大数据里面寻找模式
帮助组织机构做出更好的商业决策。
尽管BigData可以翻译成大数据或者海量数据,但大数据和海量数据是有区别的。
定义一:大数据 = 海量数据 + 复杂类型的数据
大数据包含了海量数据的含义,而且在内容上超越了海量数据,简而言之,大数据
是海量数据+复杂类型的数据。
但彬进一步指出:大数据包括交易和交互数据集在内的所有数据集,其规模或复杂程度
超出了常用技术按照合理的成本和时限捕捉、管理及处理这些数据集的能力。
大数据是由三项主要技术趋势汇聚组成:
海量交易数据:在从ERP应用程序到数据仓库应用程序的在线交易处理(OLTP)与分
析系统中,传统的关系数据以及非结构化和半结构化信息仍在继续增长。随着企业将更多的
数据和业务流程移向公共和私有云,这一局面变得更加复杂。
海量交互数据:这一新生力量由源于Facebook、Twitter、LinkedIn 及其它来源的社
交媒体数据构成。它包括了呼叫详细记录(CDR)、设备和传感器信息、GPS和地理定
映射数据
原创力文档


文档评论(0)