探讨统计误差对统计数据影响.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
探讨统计误差对统计数据影响

探讨统计误差对统计数据影响   摘要:本文通过引进统计误差这个概念,阐述了统计误差对统计数据的影响,解开了近几年社会对统计数据失真这一现象的疑团。接着结合作者多年工作实际,提出了几点应对策略,以解决统计误差与统计数据之间的矛盾,提高统计数据的精准性,从而更加有效地开展统计工作。   关键词:统计误差;统计数据;失真   中图分类号:C829.2 文献标识码:A 文章编号:1001-828X(2012)09-00-01   人们对统计的关心只局限于统计的结果——数据,而对统计还没有一个初步的认识,对统计的过程还不了解,对统计的内在关系还很朦胧,总是认为统计就和做实验一样,得出的数据分毫不差。然而,就统计而言,它的样本是多个活动的群体,在群体间和群体内部存在着时间和空间的差异,在单个样本中又存在着文化、信仰的差异,在统计过程中又存在着调查方法的差异。因此,统计数据在受到多方面的影响下,必定会产生与人们所处的环境不相一致的结果,也就是目前社会上说的统计失真。其实,造成这种现象一方面是源于人们对统计的不了解,另一方面就是统计误差。那么什么是统计误差,它对统计数据有什么影响呢?我认为有必要进行论述。   一、统计误差的分类   首先,误差是指一个量的观测值或计算值与其实际值之差;统计误差,即反映某指标的一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量。那么统计误差有哪几种呢?   1.按产生统计误差的性质来分有:空间误差、时间误差、方法误差和人为误差四种。   空间误差是指统计调查范围所产生的误差,包括重漏统计调查单位,跨区域统计等。   时间误差是指统计调查对象因时期或时点界定不准确所产生的误差。   方法误差是因使用特定的统计调查方法所产生的误差。如抽样调查中的代表性误差(抽样平均误差),它是指采用抽样调查方法中的随机样本(非全面单位)来推算总体所产生的误差的平均值,不是绝对的统计误差。对代表性误差可以根据组织方法和抽取本的容量,一般可以计算其平均误差,而且通过扩大样本量或优化调查的组织方法来缩小。   人为误差是指在统计设计、调查、整理汇总和推算等过程中因人为过错产生的误差。人为误差是统计误差中产生因素最多的一类,它又分为度量性误差、知识性误差、态度性误差和干扰性误差。   2.统计误差按工作环节来分有:源头误差、中间环节误差和最终误差三种。源头误差是指起报单位或申报者所产生的误差;中间环节误差是指统计调查数据在逐级上报过程中所产生的误差,包括加工整理、汇总和推算等环节;最终误差是指下级各基层数据汇总数或规范的方法得到的推算数与最终使用数之间的差异值。按工作环节划分的统计误差类别是相对的,中间环节误差在不同的场合有可能是源头误差,也可能是最终误差。源头误差在有些场合也叫调查误差,或叫登记误差。   二、统计误差对统计数据的影响   上面我们对统计误差的来源进行了分类,但在现实工作中统计误差是同时产生的,分不清是哪一种来源。而统计是数据的收集与汇总分析,讲的是宏观而不是微观,因此统计的误差是客观存在,不以人们意志为转移的。那么统计误差在统计数据中有什么影响呢?   1.空间上的不可比。人们在应用统计数据时,关心的是某一指标的绝对数,或是与相邻地区的对比,或是与自己实际情况的对比。而统计数据是多个调查单位或是样本的平均数,首先在不考虑统计误差的情况下就不能与自己相关联。其次,由于各地方调查单位不同,不论是采用全面调查还是抽样调查,其统计结果与实际值都有偏差。例如:就我们所关心的职工平均工资而言,目前的调查单位主要是机关事业单位和国有企业,私营、个体企业由于在统计中存在很大的难度还没有纳入统计范围。而机关事业单位和国企在工资待遇上一般比较稳定,因此,在统计上其数据明显与当地的实际情况有较大的差别。而在不同的地区,机关事业单位和国企内部的比重、工资福利又有较大的差别,金融中心城市的平均工资必定较高,与实际值相差较大。因此,在同等水平的不同地方平均工资相差较大。如果是抽样调查,在采用相同抽样方法的条件下,由于样本的分布不同,最终的抽样结果也千差万别。   2.全国数据与地方数据的不可比。目前我国统计是两条腿走路的模式,全国公布的数据是以国家调查队抽样调查推算取得的,其特点是快速,受地方干扰少。但也有相应的缺点,就是以点带面,不能全面反映全社会的国民生产情况,地方数据是通过全面调查逐级汇总而来,虽然数据的来源比较全面,但受到干扰多,重复计算现象严重。   3.部分统计指标的不可比。在目前统计制度下我们的很多统计指标都是通过抽样调查取得,不论是是PPS(规模成比例抽样)抽样,还是等距抽样,在样本排队时需要一定的主标识和辅助标识,这些标识必须要经过全面的调查才能得到,要全面掌握这

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档