- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学大数据驱动学科发展
中国信息化周报/2014 年/6 月/16 日/第 005 版
趋势
科学大数据驱动学科发展
中国科学院院士 郭华东
上个月 IDC 的“数字宇宙”研究报告指出,全球数据总量将以每两年翻一番的速度持续增长。
去年只有 20% 的数据与云相关,几年之后将翻倍至40% ,这是一个非常重要的数据。如今在全球
数据的分布中,中国占了 13%。6 年以后,全球 21% 的数据将在中国,这将是占全球五分之一的
数据,所以说中国所拥有的数据在国际上举足轻重。
大数据的持续发展
上个月 IDC 的“数字宇宙”研究报告指出,全球数据总量将以每两年翻一番的速度持续增长。
去年只有 20% 的数据与云相关,几年之后将翻倍至40% ,这是一个非常重要的数据。如今在全球
数据的分布中,中国占了 13%。6 年以后,全球 21% 的数据将在中国,这将是占全球五分之一的
数据,所以说中国所拥有的数据在国际上举足轻重。
大数据的持续发展
有一位尊敬的学者曾经讲到:“信息科学的发展使人们难以预料,如果你想让哪一个人犯错误,
那么你就让他预测 5 年以后信息技术的发展。”作为我们云计算、大数据实际上也是同样的原理,
大数据目前在哪个位置上对我们将来的研究是至关重要的。
1997 年第一篇大数据文章的起源,2004 年里程碑式的发展,2006 年持续发挥作用作用,2011
年,大数据获得成功。
科学领域对此非常重视,6 年前在科技领域,大家最为尊崇的两大期刊,一个是《自然》,一
个是《科学》。《自然》对很多入来说,它做了很多有关生命起源的专题,像大爆发,像东北鸟的
起源等等,但是 6 年前《自然》杂志也出版了大数据的专刊。2009 年《第四范式》出版是一个非
常重要的里程碑,后续有 2010 年《无处不在的数据》,3 年前《科学》专刊也出来了。科技界的
重视、全球的重视,引起了联合国足够的重视,联合国的一个报告白皮书《大数据促发展,挑战
与机遇》接踵而至,紧接着两年前高德纳的 4V 定义,同时在我们这个领域也发表了一篇文章,
提出了大数据与数字地球的关系。
然而,虽然目前在大数据方面热度最高的国家是印度,但是我们国家有关决策部门对此重视
程度也是相当高,特别是近一两年反映在我国部署的 973 计划、863 计划,也包括我国的经信委
也在部署大数据科学计划,工业部门和一些地方也在做同样的计划。
同样在国际组织上,可以看到都在不断地推动发展和全球计划,OECD 发布了《控索数据驱
动型创新》报告,指出利用数据来刺激提升生产力,充分发挥大数据的潜能,造福人类,进一步
阐述了大数据未来的潜力和作用。国际科联在 2011 年之前就开始做战略规划,在 2012-2017 年的
战略规划中特别强调了数据、信息对于科学驱动的着手,在数据中间特别强调了大数据的作用。
大数据在科研领域的发展现状
作为国际科联的一个委员会,CODATA——国际科联科学数据委员会也专门召开了一个大数
据会议,邀请了 DWS 等重要的数据组织,同时也邀请了国科联的未来地球计划,邀请了全球综
合减灾计划,以及 83 个国家和 72 个国际组织构成的一个政府间国际组织。前段时间,我在的中
科院遥感数字研究所也召开了相关会议,大家讨论的就是大数据到底对我们的学科发展能带来什
么,大数据为全球的科学计划起到了什么样的重要作用。
为了做这样的研讨,在全球范围内我们做了一些基础性工作。比如以 BIGDATA 为关键词进
行检索,出现相关文章一千多篇,半数都是 SCI 收录的文章。从国家分布来看,如果说以 40 篇
第 1 页 共 3 页
为一个界限,超过 40 篇的有七个国家,从文章发表来看,中国有 181 篇仅次于印度,位居全球
第二从中可以看到中国对大数据的研究发展是鼓舞人心的。
关于大数据的定义,仍在不断的探讨之中,其中 4V 是大家感兴趣的重要话题。大数据时代
以及大数据计算的本质特征在于从模型驱动到数据驱动范式的转变以及数据密集型科学方法的
确立。
如今科学范式也出现了转化,几千年前以实验为手段描述自然,数百年前利用模型和归纳方
法进行论证的分支出现了,过去数十年进行计算分支仿真模拟,现在当大数据时代到来时,将理
论、实验、计算仿真等统一起来形成了新的密集计算
文档评论(0)