抽样调查回收率对推论可信度的影响.docVIP

下载本文档

6
0
约1.2万字
约 12页
2017-02-12 发布于重庆
举报
版权申诉

抽样调查回收率对推论可信度的影响.doc

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

抽样调查回收率对推论可信度的影响

抽樣調查回收率對推論可信度的影響分類：Statistics 2007/11/11 14:18 ?時間? Mon Apr? 7 19:13:13 2003 ～ ?時間? Wed Apr? 9 18:39:28 2003 ? 所謂「抽樣調查」, 指的是以隨機抽樣程序從符合研究目的之特定群體 (抽樣群體) 抽取樣本。為簡單計, 這裡專指簡單隨機樣本, 並假設:(1) 群體相對於樣本很大, 例如 50 倍以上。因此可以當??? 做無限群體看待, 而不需區分抽樣是採抽出後放還法??? (with replacement),或採抽出後不放還法 (without??? replacement)。(2) 假設抽樣群體和目標群體一致。雖然實務上很難完全??? 一致; 但一個嚴謹的調查計畫通常會儘力找到相當一??? 致的抽樣群體。所謂「(問卷)回收率」或「(問項)回覆率」, 指原抽選樣本個案中, 有填寫可用資料, 且對所論問項有給出回答的個案所佔比例。有替代樣本的抽樣調查, 其替代樣本係事先與正選樣本同時抽出, 並在當時即訂定嚴格的替代程序。在此情況下, 回收率是以正選樣本數加上考慮過的替代樣本數 (不論是否有去訪, 是否有完訪) 為分母計算的。一般對調查資料之分析, 是以所獲得樣本結果直接當做群體的代表。這其實隱涵一個假設:? 樣本個案是否接受調查, 以及是否回答所論問項, 與? 個案本身的特質是無關的。以統計上的術語來說, 就是假設「完全隨機遺失(missingcompletely at random)」。有許多關於「遺失資料」的統計校正方法, 則是假設? 樣本個案是否回答所論問項, 在控制某些基本特性之? 後, 與個案的其他特質 (尤其是反應本身) 是無關的。統計上的術語稱這種資料遺失是「隨機遺失」。然而, 事實上, 我們常缺乏足夠的知識來証實遺失是隨機的; 相反地, 許多情況遺失是不可忽略的 (non-ignorable)。若所論問項的回應屬計量資料, 假設問項回覆率 (回覆者佔全抽選樣本比例) 是 r。假設回覆者回覆的平均值是 m1,標準差 s1; 未回覆者若回覆, 其平均值是 m0, 標準差 s0。因此, 若回覆率 100%, 則樣本平均值??? m = r*m1+(1-r)*m0樣本變異數 (假設樣本數夠大, 不需計較計算樣本變異數時分母是 n 或 n-1 的問題) ?? s^2 = r*s1^2+(1-r)*s0^2 + r(1-r)(m1-m0)^2 假設回覆樣本有完全的代表性, 即完全隨機遺失 (MCAR),則以 m1 估計群體平均, 其標準誤以 s1/sqrt{nr} 估計之,其中 n 是抽出樣本大小, 而 nr 即是實際回覆所論問項之樣本大小。然而, 如前述, 假設 MCAR 並無充分証據; 因此事實上以 m1 估計群體平均(=E[m]) 有偏誤。在隨機抽樣的假設下 m 是不偏的 (但不可觀測), 故 m1 的偏誤可表現為?????? bias ～ m1-m = (1-r)(m1-m0)和回覆/未回覆差異 (m1-m0) 及未回覆率 (1-r) 都成正比。這樣講可能難以明白....只看到一堆符號....讓我們以數字來表現其差距。假設回覆率 r=90%, 回覆者的平均反應是未回覆者的 85%,即 m1=0.85*m0, 則偏誤大約是?? (1-0.90)*(0.85*m0-m0)= -0.015 m0而不偏樣本結果應是?? 0.90*(0.85*m0) + 0.10*m0 = 0.865 m0因此相對偏誤為 1.7% (=0.015/0.865)。若回覆率沒那麼高, 例如 r=70%。不同回覆率我們不一定能假設回覆/不回覆的相對或絕對差距維持一樣。先假設m1=0.85*m0, 故?? 偏誤～(1-0.70)*(0.85*m0-m0)= -0.045 m0而不偏樣本平均應是??? 0.70*0.85m0 + 0.30*m0 = 0.895 m0相對偏誤為 5.0%。在回覆者反應偏低的情況, 即反應值高者不回覆機會較大。高回覆率通常代表調查執行者努力爭取回覆。若反應值較低的回覆率已高, 而反應值高者回覆率較低, 那麼, 可能調查者的努力會縮減 m1 與 m0 間的差距。相對地,在90%回覆率兩者相對差 15%(=1-0.85), 表示回覆率 70% 時兩者之間的差異可能不只 15%。例如假設 m1=0.80*m0, 則?? 偏誤～(1-0.70)*(0.80m0-m0) = -0.06m0?? 不偏樣本平均 = 0.70*0.80m0+0.30*m0 = 0.86m0故偏誤率為 7.0%。