- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实战:面对风险如何驾驭大数据?
论文类别:计算机 - 互联网研究
上传时间:2015/10/30 7:17:00
论文作者:未知
(中讯)到2018年全球大数据方面的开支将达1140亿美元,是5年前的3
倍;到2020年全球大数据规模将达44ZB(泽字节),是2013年的10倍。下一
波大数据浪潮即将来袭,但是并没有多少组织为此做好准备。如果应对措施不
当,你可能就不是弄潮的那个,而是被浪尖打翻的那个。如何为驾驭大数据做
好准备呢?
1140亿美元。这是2018年全球组织在大数据方面的开销,仅仅5年的时间
就增长了300%以上。但是这些投入有多少是值得的呢?
过去10年,我们目睹了大数据管理新方法的广泛应用,如MapReduce、供大
规模存储使用的非模式化数据库,以及用于存储和处理的Hadoop、Storm和
Spark等。但是大数据的使用不仅仅是特定平台或范例的部署而已:通常这意
味着公司对数据的建构和组织进行彻底的重新设计。
但据调查发现,目前还没有多少组织为新的数据平台和能力做好基本准备。
只有35%的组织拥有了“健壮的数据捕捉、管理、验证及保存流程”,更有67%
“缺乏衡量定义明确的大数据行动成功的标准。”那些大数据解决方案基本都
是被动集成进来的。
但时间可不等人,根据2014年IDC 的报告,到2020年,全球的数据总量将
达44ZB,整整是2013年的10倍。面对着下一波的数据大爆发,那些未做好准
备的公司将可能就会有背负运营和技术双重债务的风险,并因数据落后而被淘
汰出局。
具体而言,这些风险体现在以下几个方面:
企业丧失透明度
业界将面临大规模的技能短缺问题——很少有IT专业人士有经验管理大规模
的大数据平台。根据麦肯锡的分析,到2018年,美国将出现150万名有能力做
出基于数据决策的经理。为了缩短这一鸿沟,麦肯锡估计企业将需要把数据和
分析预算的50%投入到一线经理的培训上面。但是还没有多少公司意识到这一
点。
随着数据需求的扩大,如果对信息管理缺乏深刻理解,对数据扩展性缺乏最
佳实践,那么在管理数据驱动的系统时就会遭遇到重大挑战。而糟糕的运营透
明度会导致企业很难识别出数据何时不准确和无意义,甚至连关键报表和指标
是否正确运行都不知道。理清这些错综复杂并对数据提出正确的问题将成为IT
人员的必备技能。否则就会缺乏对企业运营的可视性,无法有效做出知情决策
并削弱企业的竞争优势。
人工成本飙升
据估计2014年时数据科学家50-80%的工作时间花在了数据集清理和处理
上。近期公司往往倾向把数据准备工作的自动化外包给离岸或近岸的数据专
家。对CloudFactory、MobileWorks及Samasource这类微工作平台的需求已经
爆发,据估计,到2018年这类业务的规模将达到50亿美元。
但是外包无法规模满足需求。鉴于未来的数据量将达到44ZB,数据的这种快
速增长会需要成千上万具备长期可行的解决方案的离岸或近岸外包团队。而任
何可持续的解决方案都离不开显著的自动化。
通信障碍
现在企业间的交互依靠的是经过组织的数据,但与未来20年发生的事情相
比,这种组织数据的过程将会显得苍白无力。未来将会出现新的企业数据网络
标准以及相应的算法和元数据。未能参与到这一全球数据市场的公司将无法利
用市面上销售的这些数据产品。
全球各个领域都在发生这种朝着大规模商业数据共享的演变。比方说,在要
求第三方验证其研究的压力之下,像葛兰素史克这样的药企最近都拟定了更广
泛共享实验数据的计划。奥巴马总统已经要求技术公司共享潜在黑客威胁的数
据。Forrester最近的一项研究预测,数据服务将成为2015年的主流产品。按
照这种节奏,10年后大数据的有效使用不仅会成为市场致胜的关键,而且还是
参与市场的先决条件。
这些风险就像一个个大数据的定时炸弹,对你构成严峻挑战。不过如果你采
取下面的三个步骤,危险也许就可以解除。
1、不要走一步看一步
为了确保未来的分析能力,企业必须现在就开始投资一个能够快速有效管理
新数据集的平台。应该考虑业务未来在数据摄入与联合方面如何运作,如何从
传统的系统过渡到端到端的自动化的数据与分析。
其核心是这个平台要能够有目的地、小心地、透明地扩充,而不是光收集数
据,但对这些数据使用却没有明确的目的,或者在数据的解析上不做投入。
2、再痛也要重建旧数据应用架构
许多公司过度依赖维护开销很高的旧系统,导致升级或作出战略变革的优先
性被贬低。甚至一些大公
您可能关注的文档
最近下载
- 【有“化”好说1】必修1 物质的量、氧化还原反应.pdf VIP
- 读《思维导图与小学英语教学》有感.docx VIP
- 《旅游景区服务与管理》教案 第7课 熟悉旅游景区的自助式解说服务.docx VIP
- PSA15000Nm3h制氢装置操作手册.pdf VIP
- 《旅游景区服务与管理》教案 第6课 做一名优秀的景区讲解员.docx VIP
- 《旅游景区服务与管理》教案 第5课 认识旅游景区的解说服务.docx VIP
- 开利吊顶式新风机新样本N-DBFP(X)DFP(X).pdf VIP
- 【大单元教学】第四章 中国的经济发展 单元教学分析 人教版地理八年级上册.docx
- 历届茅盾文学奖获奖作品名 单.doc VIP
- 检验仪器分析技术 课件 第一章 临床检验分离仪器.pptx
文档评论(0)