- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
院士梅宏真正的大数据应用体现在数据挖掘的深度-农业专业知识
院士梅宏:真正的大数据应用体现在数据挖掘的深度
2016 CCF 大数据与计算智能大赛于2016 年9 月24 日在中国·北京梅地亚中心酒店开
幕。北京理工大学副校长,中国科学院院士梅宏在会上做了《大数据与数据驱动的智慧》的
演讲,探索了大数据带来的挑战和可能的应用。梅宏认为,目前来讲,大数据还在炒作的
阶段,真正的大数据应用应该体现在数据挖掘的深度。在演讲的梅宏最后提出:当自演化的
软件能够让机器自己改代码的时候,才是真正的类脑智能。
以下为梅宏院士演讲全文:
*根据主办方提供的速记整理,在不改变原意的情况下,部分有删改。
我今天的题目叫做大数据与数据驱动的智慧,首先我大概分成四个部分,谈谈我对大数
据的认识,我想讲四个部分,第一个谈谈对大数据的认识,第二个大数据给我们带来什么
挑战,第三个大数据应用,最后结合我们的主题讲讲数据和智能的关系,主要谈我的理解。
认识大数据
所谓大数据,它是我们信息化到一定阶段之后,必然出现的一个现象(自然现象),主
要是由于信息技术不断的成本化,不断的廉价化,以及互联网及其延伸出来的,带来的信息
技术无处不在的应用所带来的自然现象。
基本上有几个主要的驱动力:
一个是摩尔定律所驱动的指数增长模式;
第二个是我们技术低成本化驱动的万物的数字化;
第三个就是宽带移动泛在互联驱动的人机物广联连接,以及最后大规模的汇聚。
实际上大数据正在带来我们新的一拨数据化的浪潮,信息化的第三拨浪潮3.0。
如果我们回顾来看我们的过去的话,我们大体上能够看到两个明显的阶段的划分,一
个是在从PC 机开始进入市场以来,应该说带来了信息化的第一拨浪潮,这个浪潮差不多到
90 年代中期,这个时候的主要特征是单机应用为特征的数字化特征,我们主要完成简单的
工作上最核心业务的数字化的工作,以PC 机为主。
在过去的20 年,90 年代中期到现在,以联网应用为特征的网络化出现数据大集中,开
始全国范围内的大联网等等,各个企业甚至走向企业全球,现在我们正在进入新的阶段,这
个以数据的深度挖掘和融合应用为特征的智慧化,或者智慧化的现象。
到底什么是大数据,这两个定义从两个角度来谈:
一个从技术上来讲,我们的技术供给能力不足所面临的对象他称之为大数据,第二是
从数据特征讲的数据,这是两个数据的定义。
应对大数据
大数据带来的是什么,我觉得最重要的东西可能带来的是思维模式的变化,如果回顾
来看看我们过去,基本上定义这不一定是大家都能够接受,但是能够去查的话,定义出现所
谓的大数据是在上个世纪的时候,97 年的时候,SGI 的首席科学家曾经用了这个词,他讲
了数据提到大数据,特别强调从技术的视角来看,所谓的难获取,难预测,难处理,难组织
四个难题。而从商业视角与大数据时代这本书的发行,开始探讨大数据在商业里面的应用,
特别强调了几个很重要的特征,从随机样本到群体数据等这么一个变化。
这是我们经常讲的大数据的价值和意义,大体上分成几个方面。
一个通过大数据,我们能够认识复杂系统的新思维,促进经济转型,提升国家综合能
力保障国家安全,提升政府的治理能力以及服务民生服务社会的能力。
这是我在几个场合讲的一个我对当前数据状况的一个认识,以及个人的一些见解,时间
关系我不会详细的说,我觉得目前来讲,大数据开始还在炒作的阶段,至少到我们中国炒
作的热潮还没有过去,所以我们相对于国外的炒作,国外开始进入我们还滞后了3 到5 年,
真正的大数据应用应该体现在数据挖掘的深度。原因有三点:首先有我们对数据认识不到
位的原因,还有在当今的情况下一宣传大家都很热,成为了获取资源的途径。不聊大数据就
拿不到项目,这也是一个很重要的原因;第二个是大数据投入过热,资源浪费比较明显,
这方面的投入特别是数据中心的投入为典型;第三个就是我们认为大数据的理论和技术都
还处于发展的早期,所以我们定义已经有了共识,但是对它的核心观点和命题还是有很多争
议的,比如说大和小,到底怎么来定义,关联和因果的辩证性,所有都讲关联不求因果的吗,
所有的数字化的东西相对于客观世界而言也仅仅是一个抽样而已,不管是它的时间密度,空
间密度到底有多大。第二是不是有通用的技术体系也不太敏感,从我们做计算领域研究的人
来讲,总是希望能够为数据的处理方式提供一种手段。数据科学的理论基础还没有,比如说
传统的统计方法,他有一个数据统计的基
文档评论(0)