- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样框又称
抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
好的抽样框应做到:完整而不重复。
常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。在没有现成的名单的情况下,可由调查人员自己编制。应该注意的是,在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。
例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。
抽样框的误差
抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是,从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况,这就存在抽样框误差。举个例子,以电话号码薄作为抽样框,在对某地区所有住户进行的某种意向调查时,就存在着抽样框误差。
理想抽样框的标准是能够实现目标总体与抽样总体的一致,然而在实践中由于设计或是资料本身等方面的原因,目标总体与抽样总体往往不一致,无法保证样本的代表性,而且由于目标总体单位数不准确,对总体进行估计时就会产生估计量偏倚,增大其方差。这种误差并不是来自抽样的随机性,而是产生于不完善的抽样框,因此称为抽样框误差。抽样框误差是一种非抽样误差。
抽样框误差来源
丢失目标总体单位
丢失目标总体单位也被称为“涵盖不足”,是指抽样框没有覆盖全部目标总体单位,有些目标单位没有在抽样框中出现,因而也就没有机会被选人样本,这些单位成为丢失目标单位。对丢失的总体单位不能发现并纠正会造成调查中对总量的估计偏低。
包含非目标单位
包含非目标单位也被称为“过涵盖”,是指抽样框中包含了一些不属于研究对象的非目标总体单位。这种偏差的影响很大,但是潜在威胁却通常会小一些。因为可以在调查中辨认出非目标元素并把它们剔除。一般情况下,由于抽样框中存在非目标总体单位,容易造成估计量的高估。
丢失目标单位和包含非目标单位共存
丢失目标单位和非目标单位共存是指在抽样框中既有丢失目标单位,也有包含非目标单位。在实际调查中,丢失目标单位不易被查觉和发现,具有较大的隐蔽性,相比之下,包含非目标单位的抽样框误差的威胁性要小些。因为在调查过程中,非目标单位容易被发现,并予以剔除。此外,如果丢失目标单位和非目标单位数量相当,也相互抵消,估计量是否会产生偏差也难以断定。这要取决于丢失目标单位和非目标单位的数量特征是否有显著差异。
复合连接
复合连接是指抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或是多对多模式的现象。在前一种模式中,若进行简单随机抽样,能保证每个目的总体单位以同等的可能性被抽中。在后两种模式中进行简单随机抽样,每个目的总体单位被抽中的概率是不同的,从而使估计量产生偏斜。例如:若某银行想了解其客户的情况进行一次抽样调查,则该行所有客户构成目的总体。选择的抽样框是银行的来往帐目,这就构成了多对一模式。若在这个框中进行抽样,则来往帐目多的客户被抽中的可能性则较大,反之来往帐目少的客户被抽中的可能性很小,而两种客户通常会有较大差异,从而造成样本的偏斜,使估计量产生偏差。
不正确的辅助信息
不正确的辅助信息误差也被称为称为“内容上的偏差”,这种误差的主要影响是降低估计的精度。许多抽样框中包含了辅助信息,可用于特殊的抽样设计和估计技术。可用这些辅助信息来进行分层抽样,对规模大小的测度用于与规模成比例的概率抽样。如果辅助信息的特征与研究的调查变量的特征高度相关,还可以用于比率估计和回归估计。但是这些辅助信息可能有错误,或者是一些抽样单位不具备辅助信息,那么就会对抽样精度产生巨大的影响。
抽样框老化
抽样框老化又被称为“抽样框过时”或“不准确的抽样框”,是指随着时间的推移,抽样总体与目标总体产生极大的偏差,即原来的抽样框不符合实际情况,必须进行更新。最典型的例子,就是随着城市建设的大规模展开,许多地区已被改造,地址发生了变化,如果仍按以前的抽样框去抽样,那么精度就会难以控制。
减少抽样框误差方法
1、在抽选样本之前,要对抽样框加以检查,发现可能存在的问题,进行识别、处理,并采取一定措施加以补救。
可以和普查或其他调查资料的总值或记录等相比较、分析,进而查明是否存在遗漏。可以利用客观现实的相互联系,找出平衡关系,推算是否有偏差。发现存在问题时,要及时进行补救。当一些目标总体单位对调查结论不会产生太大影响时,可重新把抽样框定义为可以得到的目标总体单位,将抽样框视为旧抽样框所能提供的总体。当抽样框
文档评论(0)