网站大量收购独家精品文档,联系QQ:2885784924

政府统计视阈中的大数据心思想刍议(何强)政府统计视阈中的大数据核心思想刍议(何强).doc

政府统计视阈中的大数据心思想刍议(何强)政府统计视阈中的大数据核心思想刍议(何强).doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
政府统计视阈中的大数据心思想刍议(何强)政府统计视阈中的大数据核心思想刍议(何强)

政府统计视阈中的大数据核心思想刍议* ? ?何 强 ?   内容摘要:大数据时代为传统的政府统计带来了重大发展机遇。本文基于政府统计视角,从大数据的概念、数据源、处理技术、制度建设以及在中国政府统计的应用5个方面,逐一探讨大数据的核心思想,并为把大数据打造成中国政府统计数据源“第二轨”的改革目标提出了相应的发展建议。 ?   关键词:大数据;政府统计;数据源;处理技术;统计制度 ?   中图分类号:C829.2  文献标识码:A  文章编号:1004-7794(2015)02-0050-04 ?   DOI:10.13778/ki.11-3705/c.2015.02.010 ?   当前,大数据已成为重要的国家战略资源,正在深刻地影响着时代发展进程。面对大数据的汹涌来袭,认真厘清大数据的核心思想,是充分利用大数据催生大变革的重要基础。作为数据重要生产者和使用者的政府统计部门,同样面临着大数据时代的挑战、影响??难得的发展机遇。海量实时的大数据,极大拓展了政府统计的内容和范围,能够更方便地验证补充传统统计数据,有利于提高统计工作效能。同时,大数据也冲击着传统统计的理论、观念和生产方式,在数据生产、搜集、分析、清理、挖掘等方面对政府统计提出了新的要求。本文基于政府统计视角,从大数据的概念、数据源、处理技术、制度建设以及在中国政府统计的应用情况5个方面,逐一探讨大数据的核心思想,并进一步探讨其未来的发展模式。 ?   一、大数据概念的核心 ?   迄今为止,大数据仍无权威统一定义,已有的研究绝大部分均使用描述方法探讨大数据概念。这种现状一方面表明很难对大数据概念统一界定,另一方面也表明大数据概念本身目前仍在持续发展之中。综合联合国(2012)、世界经济论坛(2012)、麦肯锡公司(2011)、IBM公司等著名国际组织和企业,以及涂子沛(2012)、维克托(Viktor M., 2013)等知名大数据专家的观点,基本认同大数据一般具有数据量大(Volume)、数据类型多(Variety)、处理速度快(Velocity)、应用价值大(Value)等特点,也即是文献中常提到的“4V”。此外,近两年有一些研究认为大数据的特点还应该包括精确性(Veracity)、数据获取与发送方式自由灵活(Vender)等。虽然这些描述性观点很少直面大数据概念的核心,但却非常有助于培养对大数据的感性认识。 ?   从大数据现象的历史发展进程来看,在20世纪80年代初期,大数据只是意味着数据量级大,它还有一个相关的术语叫海量数据。进入20世纪90年代以后,大数据开始包含数据生成速度、数据处理技术、数据存储等内容。2010年以来,大数据开始被美国、英国等发达国家,以及联合国、OECD等国际组织上升到战略层面,其内涵被逐渐丰富。从目前对大数据的研究进展来看,从本质上讲,在大数据概念的逻辑中,数据、技术和思维是三位一体的,核心是将数据视为资产。基于这种思路,各个领域可以参照自身的特点对大数据进行定义,没有必要强行将所有领域的大数据统一界定。大数据的概念界定还是应该主要服务于大数据在各个行业的发展。也是从这种思路出发,2013年由中国国家统计局局长马建堂主编的《大数据在政府统计中的探索与应用》一书中,就将大数据定义为“对政府统计工作而言,大数据是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理和挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成”。这种定义具有鲜明的统计部门特色。 ?   二、大数据数据源的核心 ?   大数据本质上也是数据,因此数据源对大数据而言具有天然的重要性。维克托和肯尼思在其具有广泛影响力的著作《大数据时代:生活、工作与思维的大变革》中甚至认为,随着大数据潮流的持续深入发展,相比大数据技术与大数据思维,大数据的数据源将变得更加重要。尽管对这种观点见仁见智,但可以看出研究者对数据源的重视程度。对数据源的考察,一般主要体现在数据源的体征与数据源整合方面。 ?   在数据源的体征上,核心是越大越好,而且允许不精确。这一点在维克托和肯尼斯(2013)、李金昌(2014)等文献中也被多次强调。但是,笔者认为,不是所有的数据源都可以归为大数据。因为如果所有数据源都被认为属于大数据,那么就没必要提出“大数据”概念,直接用“数据”即可。所以,在遴选大数据的数据源时,应有所为有所不为。另一方面,“允许不精确”则有利于增大可用的数据源。基于这些考虑,国家统计局目前就将政府统计大数据的数据源界定在行政记录、电子商务企业数据和互联网搜索数据,而不是把社会经济中所有的数据都作为其数据源。 ?   大数据数据源整合的核心则是衔接数据标准与分类。目前,绝大多数大数据仍以各种形式零散地存在于政府部门、电商企业、电信运营商和互联网公司等数

您可能关注的文档

文档评论(0)

zyongwxiaj8 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档