大数据如何贡献大价值?以应用为中心.docVIP

大数据如何贡献大价值?以应用为中心.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据如何贡献大价值?以应用为中心

大数据如何贡献大价值?以应用为中心 大数据之热 9月的浦东新区,天气已经略有凉意。张江高科技园区一个四周是玻璃的高档办公楼里,一大早,市场部门的资深员工李小姐正在自己的座位上开始一天工作之前的热身:倒杯水,花上一刻钟到半小时在各大网站上浏览当天要闻。在她最经常去的几个论坛里,通常汽车、服装,或者旅游促销的广告会不请自来;最近她发现这种多年不变的情形有了些不经意的变化,比如刚刚跳出的这个窗口:大数据分析帮助你锁定高价值客户“大数据”和旅游论坛有啥关系?她百思不得其解。 她所不知道的是,她在浏览器搜索界面里曾经输入的“客户”、 “促销”、“通信录”等关键词,已被IE上面挂靠的抓取程序自动获取,并且被关联了相应的广告,由IE插件完成最终的广告推送。在北京郊区某处的机房里,基于“关联规则”和“聚类”等统计分析方法的分析软件在时刻不停地处理成千上万个李小姐产生的数据。 她或许还没有注意到的是,大数据和分析正在成为全世界炙手可热的概念。先是几年前谷歌首席经济学家宣称:数据分析员正成为21世纪最性感的职业;又有2012年3月29日奥巴马政府公布“大数据研发计划” (Big Data Research and Development Initiative),白宫科技政策委员会(OSTP)还成立了大数据高层指导小组以推动这一战略规划。再有就是今年的事情了,地球人都已经知道,2013年是“国际统计年”。 几个月前,JMP的老朋友Michael Rappa教授于美国众院聆讯,主题正是“Next Generation Computing and Big Data Analytics”――下一代计算及大数据分析。Rappa教授作为IAA(Institute of Advanced Analytics, NCSU,北卡州立大学高等分析学院)创始人,去年被美国科学基金会新创立的大数据委员会任命为学术联合主席。奥巴马政府的大数据研发计划资金正是来自于美国科学基金会。 国内学术界,得益于前中国人民大学常务副校长袁卫先生及其他统计学界知名教授学者的持续不懈的努力,2012年,教育部终于把统计从数学的范畴内独立出来,正式升级成为与数学、物理、化学、计算机等大学科平级的“一级学科”。 以统计学为核心的数据分析方法正在学术、工商和政府等领域显现出越来越大的价值。李小姐电脑上的变化,则是这一趋势的小小表征。 最近Gartner发布了2013年度商业智能和分析的魔力四象限图,报告明确指出,大数据和分析正在成为企业IT规划的核心。 一切的现象都在告诉人们,一个新的科技时代似乎正在来临。有些IT职业追潮人士甚至激动地认为“人类历史上第三次科技革命”即将到来。 大数据之惑 问题在于,什么是大数据?为什么人人言必称大数据? “很大很大的数据”就是大数据。对“大”的定义在不断刷新。10年前1GB数据已经很大了,今天,1000GB并不算太大。 问题其实不在于大,而在价值。“大数据”再大仍旧只是数据,没有足够有效的分析与应用,一切数据都是垃圾。纽约时报专栏作家David Brooks认为,缺乏足够有效的分析是大数据的最大问题:越来越多的数据,带来越来越多的相关性;其实很多相关性都是没有意义的,这种欺骗性质的数据关联会把数据管理者和使用者引入歧途,浪费大量的人力物力去管理、分析这些数据。 除了传统意义上人们认为的那些有行有列有数值或者文字的数据表单之外,IT技术还帮助人们收集了越来越多的其他类型的资料,比如视频,语音,图片,文档等。这些被称为“非结构化数据”。 结构化与非结构化数据每天都在成倍的增加。以道路视频监控为例,全上海的摄像头有10多万个,每一刻都在记录图片与视频。一旦发生案件或者事件,这些记录在硬盘库里的资料就成为侦察与审判环节的重要证据。尽管目前技术尚不支持,业界仍然期望未来能在TB乃至于PB级的视频数据里搜到一张特定身影或者脸孔。这类搜索/分析技术未来将是启动视频类大数据应用的引擎。 同样,基于语音、照片或者文本的分析与数据挖掘同样可以给人类对数据的理解带来革命性的突破。问题在于,这类技术仍停留在实验室阶段。 尽管没有足够的应用,大数据仍然不可阻挡地火热了起来。不扯上大数据似乎就要落伍了一样,大数据满天飞的日子来到了。至于这股潮流到底会演变成象.com一样的泡沫,还是第三次产业革命,在华威先生们眼里,已经根本不重要了。业界,数据库/存储等领域供应商当然乐见其成,而企业的IT经理们则又多了一个申请预算的借口。 数据的价值及企业数据战略 数据的获取与存储仍然是IT建设的基础架构。一旦决定启动“大数据战略”,对资源源源不断的占用使得这一工作黑洞化。如何规避这种大数据黑洞?结合全球主要行业领导企业以及部分小而强的欧洲企业的成功案例,我认为,应该以应用(分析及业务决策)为中心建立相应

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档