- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据:把预测从艺术变成科学.doc
大数据:把预测从艺术变成科学
大数据是当前最时髦的技术词汇,这股发端于互联网企业的数据分析热潮已经远远超出了互联网领域,越来越多的敢于为先的传统企业已经开始部署大数据相关技术。从中嗅出商机的厂商则因势利导推出众多相关产品,而媒体、分析机构纷纷摇旗呐喊。IDC最新发布的全球大数据市场预测称,包含结构化和非结构化的大数据正在以每年60% 的增长率持续增长,相应地,大数据市场也将从2010年的32亿美元增长至2015年的169亿美元,年复合增长率达到40%。
中国是数据生产的大国,也将是可以从大数据中受益最多的国家之一。还是IDC提供的数据,截止到2012年6月,中国有近3.9亿的移动客户、5.3亿的互联网客户。在一个中等规模的智能城市中,每个季度就可能产生出200PB的视频数据(如果以一个笔记本电脑存储200GB,那就是100万台笔记本电脑所能够存储的数据)。不过,其中究竟蕴藏着多少宝藏,还有待人们利用大数据相关技术来挖掘。这也正是大数据的魅力所在。
大数据的魅力
引发大数据热的根本原因是它能为我们开启一个新的可能,简单地说,就是让我们认识所不认识的、了解我们从未了解的,从而让我们从此前模糊的决策,变成有理有据的科学决策。多少年来,由于技术手段的限制,我们对世界的认识都是采用抽样方法,然而大数据却为我们提供了一种新的方法,让我们可以进行全样本研究。
现实中,越来越多的用户正在从大数据技术中受益。比如,北京百分点信息科技有限公司(以下称百分点)推出了一种名为个性化搜索引擎的工具,库巴等电子商务公司利用它来分析访客的点击行为,找出访客的偏好、进行产品推荐。还有,可口可乐正在通过大数据技术处理其销售数据,来分析世界各地对各种口味的饮料的偏好,从而对各种饮料进行生产资料规划,以及新产品研发。更为人们熟知的案例是奥巴马在新一任美国总统大选中利用大数据技术随时了解选民的倾向,从而开展针对性的工作,帮助他最终胜选。
未来,还有更多的大数据案例会不断涌现。与此同时,“大数据是大忽悠、大谎言”的说法也不绝于耳,甚至也引来科学界的质疑,在互联网广为流传的《大数据的诅咒(The curse of big data)》引发了业界关于“大数据好还是小数据好”的讨论。
然而这些疑问挡不住厂商们的热情。传统的IT大佬们纷纷在大数据领域投入巨资:大数据已经成为IBM今年最主要的市场战略,IBM推出拥有4大核心能力的大数据平台,即Hadoop系统、流计算(Stream Computing)、数据仓库和信息整合与治理;甲骨文推出了软硬一体的大数据库机,其中内置了Cloudera版的Hadoop;SAP以其HANA为切入点,试图在大数据市场分一杯羹;微软推出了自己的Hadoop发行版本。另外,Intel、EMC等很多厂商也都在大数据方面有不小的投入。今年年初,EMC把其Greenplum等大数据业务独立,与VMware的从事应用开发的部分合并,成立了Pivotal公司,专门针对大数据市场。
除了传统IT大佬之外,市场还有很多难以计数的初创公司,尽管这些公司不大,也许持续时间不长,但专注于大数据业务,对于大数据市场而言,它们同样也是不可或缺的一部分。
从BI到大数据
在大数据概念出现之前,在市场也有一个类似的概念红极一时,至今长盛不衰,这就是商业智能,而眼下显然大数据的风头要胜过商业智能。实际上,这两者是一脉相承的。因为大数据是以海量数据的处理和分析,发现数据背后的本质,增加企业洞察力为目的而诞生的,而这与商业智能的目的基本一致,从这个意义上说,两者之间就存在着必然的联系。毕竟,获得洞察才是我们的目标。
业内专家的建议,可以把大数据看成是传统数据库、数据仓库以及商业智能这些概念的外延和扩展可能,特别是把大数据应用到传统企业中,这一点可能更为明显。因为大数据的长处在于处理非结构化数据,而商业智能则擅长结构化数据。目前,绝大部分传统企业的商业分析已经投资于商业智能,对于结构化数据的分析和建模都相对熟悉,而对非结构化数据的分析则陌生一些,因此非结构化的数据想要被充分认知和分析,转化为结构化数据之后处理不失为一种有效方法。比如,将大数据以及聚合数据输入传统商业智能系统中去做分析与展现,最终形成报告,出分析结果。这也是传统IT厂商最推荐的一个应用方法。
当然,也并非都必须如此,比如,那些率先引入大数据技术的互联网企业就很少使用这些方法,这些缺乏传统商业智能基础的企业从一开始就将自己的解决方案完全架构在Hadoop等大数据技术上,直接从Hadoop中提出数据,利用自己定制的MapReduce,完成数据的分析和展现。
大数据落地不容易
尽管大数据市场目前看起来很美,但从整体上说这个大数据市场才刚刚起步,
原创力文档


文档评论(0)