抽样调查回收率对推论可信度的影响.docVIP

抽样调查回收率对推论可信度的影响.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查回收率对推论可信度的影响

抽樣調查回收率對推論可信度的影響 分類:Statistics 2007/11/11 14:18 ?時間? Mon Apr? 7 19:13:13 2003 ~ ?時間? Wed Apr? 9 18:39:28 2003 ? 所謂「抽樣調查」, 指的是以隨機抽樣程序從符合研究目 的之特定群體 (抽樣群體) 抽取樣本。為簡單計, 這裡專 指簡單隨機樣本, 並假設: (1) 群體相對於樣本很大, 例如 50 倍以上。因此可以當 ??? 做無限群體看待, 而不需區分抽樣是採抽出後放還法 ??? (with replacement),或採抽出後不放還法 (without ??? replacement)。 (2) 假設抽樣群體和目標群體一致。雖然實務上很難完全 ??? 一致; 但一個嚴謹的調查計畫通常會儘力找到相當一 ??? 致的抽樣群體。 所謂「(問卷)回收率」或「(問項)回覆率」, 指原抽選樣 本個案中, 有填寫可用資料, 且對所論問項有給出回答的 個案所佔比例。有替代樣本的抽樣調查, 其替代樣本係事 先與正選樣本同時抽出, 並在當時即訂定嚴格的替代程序。 在此情況下, 回收率是以正選樣本數加上考慮過的替代樣 本數 (不論是否有去訪, 是否有完訪) 為分母計算的。 一般對調查資料之分析, 是以所獲得樣本結果直接當做群 體的代表。這其實隱涵一個假設: ? 樣本個案是否接受調查, 以及是否回答所論問項, 與 ? 個案本身的特質是無關的。 以統計上的術語來說, 就是假設「完全隨機遺失(missing completely at random)」。 有許多關於「遺失資料」的 統計校正方法, 則是假設 ? 樣本個案是否回答所論問項, 在控制某些基本特性之 ? 後, 與個案的其他特質 (尤其是反應本身) 是無關的。 統計上的術語稱這種資料遺失是「隨機遺失」。然而, 事 實上, 我們常缺乏足夠的知識來証實遺失是隨機的; 相反 地, 許多情況遺失是不可忽略的 (non-ignorable)。 若所論問項的回應屬計量資料, 假設問項回覆率 (回覆者 佔全抽選樣本比例) 是 r。假設回覆者回覆的平均值是 m1, 標準差 s1; 未回覆者若回覆, 其平均值是 m0, 標準差 s0。 因此, 若回覆率 100%, 則樣本平均值 ??? m = r*m1+(1-r)*m0 樣本變異數 (假設樣本數夠大, 不需計較計算樣本變異數 時分母是 n 或 n-1 的問題) ?? s^2 = r*s1^2+(1-r)*s0^2 + r(1-r)(m1-m0)^2 假設回覆樣本有完全的代表性, 即完全隨機遺失 (MCAR), 則以 m1 估計群體平均, 其標準誤以 s1/sqrt{nr} 估計之, 其中 n 是抽出樣本大小, 而 nr 即是實際回覆所論問項之 樣本大小。然而, 如前述, 假設 MCAR 並無充分証據; 因 此事實上以 m1 估計群體平均(=E[m]) 有偏誤。在隨機抽 樣的假設下 m 是不偏的 (但不可觀測), 故 m1 的偏誤可 表現為 ?????? bias ~ m1-m = (1-r)(m1-m0) 和回覆/未回覆差異 (m1-m0) 及未回覆率 (1-r) 都成正比。 這樣講可能難以明白....只看到一堆符號....讓我們以數 字來表現其差距。 假設回覆率 r=90%, 回覆者的平均反應是未回覆者的 85%, 即 m1=0.85*m0, 則偏誤大約是 ?? (1-0.90)*(0.85*m0-m0)= -0.015 m0 而不偏樣本結果應是 ?? 0.90*(0.85*m0) + 0.10*m0 = 0.865 m0 因此相對偏誤為 1.7% (=0.015/0.865)。 若回覆率沒那麼高, 例如 r=70%。不同回覆率我們不一定 能假設回覆/不回覆的相對或絕對差距維持一樣。先假設 m1=0.85*m0, 故 ?? 偏誤~(1-0.70)*(0.85*m0-m0)= -0.045 m0 而不偏樣本平均應是 ??? 0.70*0.85m0 + 0.30*m0 = 0.895 m0 相對偏誤為 5.0%。 在回覆者反應偏低的情況, 即反應值高者不回覆機會較大。 高回覆率通常代表調查執行者努力爭取回覆。若反應值較 低的回覆率已高, 而反應值高者回覆率較低, 那麼, 可能 調查者的努力會縮減 m1 與 m0 間的差距。相對地,在90% 回覆率兩者相對差 15%(=1-0.85), 表示回覆率 70% 時兩 者之間的差異可能不只 15%。例如假設 m1=0.80*m0, 則 ?? 偏誤~(1-0.70)*(0.80m0-m0) = -0.06m0 ?? 不偏樣本平均 = 0.70*0.80m0+0.30*m0 = 0.86m0 故偏誤率為 7.0%。

文档评论(0)

youshen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档