- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
郑毅-大数据让人对世界感知更丰富
郑毅:大数据让人对世界感知更丰富 郑毅,中国科学技术大学学士,中国科学院计算技术研究所硕士,是中国最早的大数据中文专著之一《证析:大数据与基于证据的决策》的作者,在人工智能、数据挖掘、商业智能等领域有十余年的研究与项目经验。目前负责北京云基地大数据实验室的运营工作。
虽然大数据概念在国内日益升温,并成为很多信息化论坛的研讨议题,但仍未被许多企业所了解,很多企业甚至认为,大数据就是海量数据,或仅限于数据存储,并不包括对数据的分析和数据价值的挖掘。
大数据概念在上世纪80年代被提出,近几年与云计算一道成名,并被奉为为与土地、石油一样具有极高价值的资源。然而大数据究竟是如何产生,又具有什么样的价值,其中孕育着一个怎样的未来呢?为答此疑惑,本刊记者专访了北京云基地大数据实验室运营工作负责人郑毅。大数据的“大”
“技术的发展使得人们在数据搜集的能力、数据传输的能力、数据存储的能力以及数据处理的能力等方面取得了极大的进步,这使得人类能够以前所未有的速度生产数据,即催生了大数据现象的诞生。”在郑毅的《证析:大数据与基于证据的决策》一书中,他将大数据首先描述为一个现象,而不是一种技术。
目前,对大数据概念并没有统一的定义。在百度百科的解释中,大数据(bigdata)也称巨量资料,是指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到掘取、管理、处理,并整理成为对企业经营决策有更积极作用的资讯。这一定义属于一种静态的名词解释,重点在于数据的本身;但大数据应该是动态的,并非单纯表象的大容量或大规模。
大数据应是多维且极具复杂性的,它产生于物理世界信息的大量数字化和互联网。对它的理解可围绕“大”进行认识,首先是数据的数量大(volumes),只要达到10TB规模以上的大型数据即是大数据;其次是数据类别大(variety),数据来源广,种类繁多,囊括了半结构化和非结构化的数据。同时,海量的数据还要具备较强的实时性(Velocity)和价值(Value)特征,否则这些数据就称不上“大数据”。
随着云计算、物联网等概念的落地,在医疗、地理信息、电子商务、交通、安防监控等领域每天都有大量的数据产生。据统计,到2015年全球数据总量将达到8ZB(1ZB=10亿TB),2020年将达到大约35.2ZB。因此,如何挖掘海量数据中的潜在价值,为人类提供可靠决策和建议,已成为各国新一轮战略部署的重点。
大数据的“价值”
“大数据涉及较多技术,目前被提及较多的是存储与计算,其中数据传输、数据挖掘、数据应用场景等也是业界讨论的焦点话题,尤其是Hadoop(分布式系统基础架构)。但大数据除了涉及底层的技术平台,以及使用技术收集、存储数据之外,更需要把数据价值化,从而为人类创造价值,这一过程就是大数据的大或价值所在。”郑毅介绍,大数据技术的定位是通过高速捕捉、挖掘和分析海量数据,从中获取价值的新技术架构。
据了解,目前Google、IBM、EMC、Oracle、微软、惠普、SAP、Teradata等巨头,一方面通过并购以后进行技术整合,另一方面依靠企业自身的研发实力,纷纷布局大数据业务,并推出了搜索服务、数据库、服务器、存储设备、企业解决方案等大数据产品及业务。由此可见大数据的价值乃至整个产业的市场潜力。
郑毅解释,大数据之所以被各行各业热捧,其原因在于大数据的核心价值是通过数据指导企业的决策,提升企业决策的效率,从而让企业获取最大价值。而如何让大数据价值化,他认为可从两方面入手,一是数据的挖掘与运算,从技术层面使数据价值化;二是数据的价值化需要对数据有创新的应用,即数据的使用和消费。
例如eBay通过建立大数据分析平台,可以准确分析用户的购物行为,对顾客的行为进行跟踪、对搜索关键字广告的投入产出进行衡量,优化后eBay产品销售的广告费降低了99%,顶级卖家占总销售额的百分比却上升至32%。此外,将大数据应用于球赛中,球队通过对比赛录像等数据进行分析,不仅能找出对手的缺点,还能更清楚地了解自身球队或球员的优劣势,从而在比赛中获胜。
正如郑毅所言,未来生活中的各种决策都离不开数据和信息的支撑,这是大潮流,也是大数据的核心价值。
“如果对某一个行业有足够了解,其实并不需要高深的数据挖掘技术,也许只需通过某一个数字就能分析行业存在的问题。如零售业的库存周转周期指标,了解零售业的人就知道这一个指标所代表的含义,因此只需在庞大的数据上针对业务场景做简单的数据处理,就能使数据价值化,让商品销量增多。”郑毅指出,要综合考虑人与数据之间的业务关系,打破传统的思维方式,抛弃英雄式的决策思路。同时,要突出大数据业务应用、保障业务的顺畅和有效的管理分析数据,这是各界关注大数据的原因,也是大数据技术要
您可能关注的文档
最近下载
- 津津有味·读经典Level3《金银岛》译文和答案.docx
- SHT3503-2017石油化工建设工程项目交工技术文件规定.pdf VIP
- 九年级下学期班主任工作总结_九年级下学期的班主任工作总结范文.docx VIP
- 九年级下学期班主任工作计划--班主任工作计划.docx VIP
- 九年级班主任上学期工作计划 九年级上学期班主任学期工作计划(通用6篇).docx VIP
- 九年级上学期班主任工作总结.docx VIP
- 八年级下学期班主任工作总结-班主任工作总结.doc VIP
- 七年级上《第2章整式的加减》测试题及答案(数学试卷新课标人教版七年级上单元试题).doc VIP
- 八年级下学期班主任工作计划-班主任工作计划.doc VIP
- 班主任上学期工作计划:八年级上学期班主任工作计划.doc VIP
原创力文档


文档评论(0)