- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
政府统计视阈中的大数据心思想刍议(何强)政府统计视阈中的大数据核心思想刍议(何强)
政府统计视阈中的大数据核心思想刍议*
?
?何 强
?
内容摘要:大数据时代为传统的政府统计带来了重大发展机遇。本文基于政府统计视角,从大数据的概念、数据源、处理技术、制度建设以及在中国政府统计的应用5个方面,逐一探讨大数据的核心思想,并为把大数据打造成中国政府统计数据源“第二轨”的改革目标提出了相应的发展建议。
?
关键词:大数据;政府统计;数据源;处理技术;统计制度
?
中图分类号:C829.2 文献标识码:A 文章编号:1004-7794(2015)02-0050-04
?
DOI:10.13778/ki.11-3705/c.2015.02.010
?
当前,大数据已成为重要的国家战略资源,正在深刻地影响着时代发展进程。面对大数据的汹涌来袭,认真厘清大数据的核心思想,是充分利用大数据催生大变革的重要基础。作为数据重要生产者和使用者的政府统计部门,同样面临着大数据时代的挑战、影响??难得的发展机遇。海量实时的大数据,极大拓展了政府统计的内容和范围,能够更方便地验证补充传统统计数据,有利于提高统计工作效能。同时,大数据也冲击着传统统计的理论、观念和生产方式,在数据生产、搜集、分析、清理、挖掘等方面对政府统计提出了新的要求。本文基于政府统计视角,从大数据的概念、数据源、处理技术、制度建设以及在中国政府统计的应用情况5个方面,逐一探讨大数据的核心思想,并进一步探讨其未来的发展模式。
?
一、大数据概念的核心
?
迄今为止,大数据仍无权威统一定义,已有的研究绝大部分均使用描述方法探讨大数据概念。这种现状一方面表明很难对大数据概念统一界定,另一方面也表明大数据概念本身目前仍在持续发展之中。综合联合国(2012)、世界经济论坛(2012)、麦肯锡公司(2011)、IBM公司等著名国际组织和企业,以及涂子沛(2012)、维克托(Viktor M., 2013)等知名大数据专家的观点,基本认同大数据一般具有数据量大(Volume)、数据类型多(Variety)、处理速度快(Velocity)、应用价值大(Value)等特点,也即是文献中常提到的“4V”。此外,近两年有一些研究认为大数据的特点还应该包括精确性(Veracity)、数据获取与发送方式自由灵活(Vender)等。虽然这些描述性观点很少直面大数据概念的核心,但却非常有助于培养对大数据的感性认识。
?
从大数据现象的历史发展进程来看,在20世纪80年代初期,大数据只是意味着数据量级大,它还有一个相关的术语叫海量数据。进入20世纪90年代以后,大数据开始包含数据生成速度、数据处理技术、数据存储等内容。2010年以来,大数据开始被美国、英国等发达国家,以及联合国、OECD等国际组织上升到战略层面,其内涵被逐渐丰富。从目前对大数据的研究进展来看,从本质上讲,在大数据概念的逻辑中,数据、技术和思维是三位一体的,核心是将数据视为资产。基于这种思路,各个领域可以参照自身的特点对大数据进行定义,没有必要强行将所有领域的大数据统一界定。大数据的概念界定还是应该主要服务于大数据在各个行业的发展。也是从这种思路出发,2013年由中国国家统计局局长马建堂主编的《大数据在政府统计中的探索与应用》一书中,就将大数据定义为“对政府统计工作而言,大数据是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理和挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成”。这种定义具有鲜明的统计部门特色。
?
二、大数据数据源的核心
?
大数据本质上也是数据,因此数据源对大数据而言具有天然的重要性。维克托和肯尼思在其具有广泛影响力的著作《大数据时代:生活、工作与思维的大变革》中甚至认为,随着大数据潮流的持续深入发展,相比大数据技术与大数据思维,大数据的数据源将变得更加重要。尽管对这种观点见仁见智,但可以看出研究者对数据源的重视程度。对数据源的考察,一般主要体现在数据源的体征与数据源整合方面。
?
在数据源的体征上,核心是越大越好,而且允许不精确。这一点在维克托和肯尼斯(2013)、李金昌(2014)等文献中也被多次强调。但是,笔者认为,不是所有的数据源都可以归为大数据。因为如果所有数据源都被认为属于大数据,那么就没必要提出“大数据”概念,直接用“数据”即可。所以,在遴选大数据的数据源时,应有所为有所不为。另一方面,“允许不精确”则有利于增大可用的数据源。基于这些考虑,国家统计局目前就将政府统计大数据的数据源界定在行政记录、电子商务企业数据和互联网搜索数据,而不是把社会经济中所有的数据都作为其数据源。
?
大数据数据源整合的核心则是衔接数据标准与分类。目前,绝大多数大数据仍以各种形式零散地存在于政府部门、电商企业、电信运营商和互联网公司等数
您可能关注的文档
- 搞好课前预习的研究搞好前预习的研究.doc
- 提高课堂教学实效性的教策略研究提高课堂教学实效性的教学策略研究.doc
- 搜索引擎推广试题二搜索擎推广试题二.doc
- 搭建Ad-hoc无线网搭建Ad-hoc无线网络.doc
- 搭建学生展示的舞台 让生在自信中学习英语搭建学生展示的舞台 让学生在自信中学习英语.doc
- 携手共进健康你我他浅谈作学习在体育教学中的应用携手共进健康你我他浅谈合作学习在体育教学中的应用.doc
- 2014年中考物理专题复 运动与力(含答案)2014年中考物理专题复习 运动与力(含答案).doc
- 携程网、中国旅游网网站比分析携程网、中国旅游网网站对比分析.doc
- 揭秘历史上五次中日战争秘历史上五次中日战争.doc
- 2014年中考语文总复习划及对策2014年中考语文总复习计划及对策.doc
- 2014年山东省嵌入式赛协作训练组选拔赛方案2014年山东省嵌入式赛项协作训练组选拔赛方案.doc
- 2014年安徽省教师招聘试笔试美术小学学段真题答案解析2014年安徽省教师招聘考试笔试美术小学学段真题答案解析.pdf
- 2014年山东省春季高考造维修类专业技能考试说明2014年山东省春季高考制造维修类专业技能考试说明.doc
- 2014年山东省济南市市区中考一模物理试卷2014年山东省济南市市中区中考一模物理试卷.doc
- 2014年山东省春季高考能考试信息技术类专业考试样题2014年山东省春季高考技能考试信息技术类专业考试样题.doc
- 2014年山东省职业院校能大赛高职组“物联网技术应用”项目竞赛规程(讨论稿)2014年山东省职业院校技能大赛高职组“物联网技术应用”项目竞赛规程(讨论稿).doc
- 2014年年度个人述职报-李志斌2014年年度个人述职报告-李志斌.ppt
- 政治-盐城市2014届三第三次模拟考试 政治 Word版含答案政治-盐城市2014届高三第三次模拟考试 政治 Word版含答案.doc
- 政治发展和国家能力政治展和国家能力.doc
- 2014年市开题报告书214年市开题报告书.doc
最近下载
- AP微观经济学 2019年真题 (选择题+问答题) AP Microeconomics 2019 Released Exam and Answers (MCQ+FRQ).pdf VIP
- 富士达电梯ZEXIA(CP41)电气原理图纸.pdf
- 2024年天津市中考语文试题(含答案解析).doc VIP
- [教学设计]苏少版八年级下册美术全册精品教案(最全).doc
- 《车用汽油》课件.pptx VIP
- 汽车改装入门.pdf
- VDA6.3-2023过程审核检查表(2023版).xlsx VIP
- 结论性审查意见(模板).PDF
- DBJ50_T-452-2023 装配式保温装饰板墙体保温系统.pdf
- 花园小区物业管理参观学习心得体会PPT.pptx VIP
文档评论(0)