- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第七章网络统计数据的甄别与筛选(张利华)
摘要:
前面提到,本课题的研究成果将为人们充分使用国家统计信息系统环境去搜集、处理和分析统
计数据提供理论和方法,从而增强国家统计信息系统的开发力度和使用效率,促进国家统计信息化
建设。我们知道,在利用互联网进行统计调查时,由于存在重复填报问题、被调查者的身份识别问
题,以及被调查者故意胡乱填写调查表以谋取利益等问题,可能造成网络统计数据失真,如何对这
些原始统计调查数据进行甄别是我们本章探讨的重点之一。此外,由于互联网上存在大量的虚假信
息,在利用互联网检索二手统计数据时也需要进行筛选和鉴别。因而,网上二手数据的甄别方法是
本章探讨的另一个重点。我们认为,利用现代管理方法和信息技术进行网络统计数据的搜集、鉴别
和分析是必要的,也是可行的,前面已经对如何利用现代信息技术进行网络统计数据的搜集和鉴别
分析作了一定的介绍,本章主要探讨网上统计数据有效性、真实性的甄别与筛选方法。
为此,本章首先明确了网络统计数据的概念,对网络统计数据的有效性和真实性给予了明确的
界定,总结出了真实有效的网络统计数据应该具有的可认知、可考证、时效三个基本特征,然后在
考察了现实统计数据甄别与筛选工作的现状后,总结目前国内进行数据甄别与筛选时常用的统计数
据审核和数理分析、后验技术、抽样技术等网下数据甄别和筛选经验,在此基础上引入了信息甄别、
数据跟踪、诚信激励、需求过滤等专门针对网络统计数据特点的四种新型的数据甄别与筛选策略,
提出了甄别应分层次进行、实行责任标签跟踪、以诚信档案为基础的诚信激励业绩考评制度、三级
统计管理体制等观点。作者认为网络统计数据的甄别与筛选不仅仅是一个单纯的技术和方法的问题,
而是一个复杂的系统工程问题,它不仅涉及到信息技术和统计方法,还涉及到管理方法和统计组织
机构重组等方方面面问题,总之,网络统计数据的甄别与筛选,是一个复杂的社会问题,不仅仅需
要从网上入手,更需要对网下数据的采集、传播和施用工作进行规范,需要从体制改革、法律法规
完善、人才培养、督察队伍构建等多方的支持和保障。
本章提要:
1.网络统计数据
2.数据资料审核法
3.离群值检验法(字数:718,由金明写)
4.数据跟踪策略
5.责任标签
6.诚信激励策略
7.诚信档案
8.需求过滤策略
9.三级统计管理体制(模式)
10.专业化统计队伍
11.统计代理制度
12.诚信激励业绩考评制度
13.统计事务所
第七章网络统计数据的甄别与筛选
前面提到,本课题的研究成果将为人们充分使用国家统计信息系统环境去搜集、处理和分析统
计数据提供理论和方法,从而增强国家统计信息系统的开发力度和使用效率,促进国家统计信息化
建设。我们知道,在利用互联网进行统计调查时,由于存在重复填报问题、被调查者的身份识别问
题,以及被调查者故意胡乱填写调查表以谋取利益等问题,可能造成网络统计数据失真,如何对这
些原始统计调查数据质量进行甄别是我们本章探讨的重点之一。此外,由于互联网上存在大量的虚
假信息,在利用互联网检索二手统计数据时也需要进行筛选和鉴别。因而,网上二手数据的甄别方
法是本章探讨的另一个重点。我们认为,利用现代管理方法和信息技术进行网络统计数据的搜集、
鉴别和分析是必要的,也是可行的,前面已经对如何利用现代信息技术进行网络统计数据的搜集和
鉴别、分析作了一定的介绍,接下来,我们主要探讨网上统计数据有效性、真实性的甄别与筛选方
法。
7.1网络统计数据甄别的基本问题
7.1.1问题的提出
伴随着网络技术的推广与应用,统计领域已充分意识到信息技术对于自身发展的重要作用和深
远影响,特别是进入20世纪中期以后,统计理论体系不断完善,统计理论继续在非参数统计、时间
序列、多元统计分析、随机过程、贝叶斯统计、决策理论等方面收获着成果。同时,统计应用在政
府统计、行业统计、企业统计实践,以及自然科学与人文社会科学的研究中,也开始发挥着越来越
重要的作用。现代统计应用的重大改变不仅体现在理论方法的丰富和应用领域的拓展方面,更重要
的是计算机和网络技术、人工智能技术等现代信息科技对统计产生了巨大的影响。伴随着计算机和
网络技术在统计领域的深入应用,统计建立的许多算法,都可以利用计算机软件技术编制成各种通
用的统计分析软件,如SPSS,S-Plus,SAS等,这使得一般的统计应用人员不必深入了解各种算法
文档评论(0)