敏感性问题随机化回答模型的改进.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
敏感性问题随机化回答模型的改进

敏感性问题随机化回答模型的改进孔圣元孟生旺ABSTRACTThepaperfirstevaluateshortageofexistingrandomresponsemodelofsensi2tiveproblems,andthensetupanewrandomresponsemodelandcalculateitsesti2matorsandvariances,finallydemonstratethatnewmodelismoreeasyinoperationandhasbetterpropertiescomparedwiththoseofthepreviousone.运用随机化回答模型,对社会敏感性问题进行调查,这种方法已越来越受到人们的重视。但现有模型孰优孰劣?如何最优设计?在实际使用模型时,这些问题是经常碰到的。本文对现有模型的不足进行了分析,在此基础上设计了新模型,并给出了最优设计方案。方差的后一部分反映了由于采用随机化回答方法而引起方差的增大,说明了宁愿牺牲某些精度来换取被调查者进行合作的思想。沃纳模型存在的主要问题是:(1)从随机化处理过程来看,被调查者仍必须回答敏感性问题,因为1号卡片和2号卡片上都是敏感性问题,只是一个问题的两种提法而已。因此被调查者可能仍然心存顾虑。一、现有模型之不足11沃纳模型美国统计学家沃纳于1965年首次提出利用随机化回答来调查敏感性问题,其基本思想是使被调查者在回答敏感性问题时能保守秘密,从而消除回答问题的顾虑,以达到配合调查的目的。方法是制作一套卡片,其中一部分卡片(可称为1号卡片),写上需要调查的敏感性问题;另一部分卡片(可称为2号卡片),写上对立的敏感性问题。将这些卡片混和,由被调查者随机地抽取卡片,对照自己的情况,作出“是”或“否”的真实回答。这样调查者并不知道在回答那一个问题,从而起到了保密作用。如果我们预先设置卡片的比例分别为p和1-p,调查的样本容量为n,回答“是”的人数为m,则回答敏感性问题“是”的估计量为:(2)显然当p=1时,最能得到被调查者的配21^合,但在该模型中,当p=2时无法得到0的估计值。(3)从方差V(0^来看,要减少模型方差就应W)使p偏离1愈大愈好,比如p018或p0115,可2以使方差的增量减少,但这又不易得到被调查者的较好配合,例如p=1或p=0时,这就等于不采用随机化回答方法。21西蒙斯模型西蒙斯模型试图在沃纳模型的基础上加以改进,其方法是在1号卡片上仍提调查的敏感性问题,而2号卡片上则是与敏感性问题无关的问题。比如2号卡片上可写上“您”是4月出生的吗?若是,请答‘1’,若不是请回答‘0’。西蒙斯模型的估计量为:[m-(1-p)]n0^W=(1)2p-1可以证明上述估计量是极大似然估计量和无偏估计量,其方差为:m^(1-P)qu-n^0()u=3pm(1-m)同样可以证得该估计量也是极大似然估计量和=nnV(0^W)n(2p-1)2无偏估计量其方差为,:经分解得:mm(1-)^^=0W(1-0W)p(1-p)nnV(0^=u)V(0^W)(2)(4)n+n(2p-1)2np260统计研究经分解得:保证他们的结构具有相似性,从而产生较大误差。^^^^)=0u(1-0u)qu(1-qu)·(1-p)2^(2)方差V(0G)是两次试验产生的方差之和。在相同条件下,它要比西蒙斯模型的方差大得多。V(0^+unnp2^^^^+p(1-p)·0u+qu-20uqu(5)()3从估计量式6和方差式7可以看出p1和()()p2np2不能太接近。特别是当p1=p2时,模型失效。要减小方差V(0^,就应增大p而减小p,但当p增大G)121时,又不容易得到被调查者的配合。41双随机化回答模型赵俊康3提出了一种改进模型,我们称之为双随机化回答模型。其方法是制作两套卡片,每一套都由两部分组成。一套卡片上提出有关问题,另一套卡片上不提任何问题。由被调查者随机地抽取二套卡片,作出真实回答。其估计量为:n方差的第二部分为由于提出无关问题,而引起的方差增大,第三部分反映了随机化回答方法引起的方差增大。其中p仍为1号卡片的比例;m为回答“1”的人数;^q为样本中具有无关问题特征的单位比例。u西蒙斯模型的改进之处在于:(1)2号卡片并不是敏感性问题,易于取得真实的回答;(2)卡片的比例可以各为1/2,有利于消除被调查者的顾虑。但仍然存在以下不足之处:2Κi^Κ-p^b^10n=pa-pb,Κ=n方差为:(1)0^^u中的qu必须预先已知或是待估计的值,^^^=0n(1-0n)+0npa(1-pa)+因而^q的估计偏误会引起0^的估计偏误。V(0^n)uun(p-p)2nn)pb(1-pb)ab(2)要减小估计方差,就应增大p值和减小^qu0^(1-n(pa-pb)2的值,但随着p

您可能关注的文档

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档