- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样设计
抽樣設計
一些大原則:
─ 認定能夠實際接觸到的母群體,也就是抽樣架構(sampling frame)。
─ 避免隨意抽樣(亦即非機率性的抽樣)。
─ 理想上是能做簡單隨機抽樣或系統抽樣。
─ 分層抽樣可以減少抽樣誤差。
─ 當母群體中每一位被抽樣的對象是分屬於某一團體時,則可考慮用隨機叢集抽樣(cluster sampling)。
─ 當母群體很大時,應考慮用多階段抽樣。
─ 決定樣本的大小是以推估母數(parameter)時所欲達到之精準度為基礎。
─ 大樣本並不能補償抽樣時的偏差或系統性偏差(sampling bias;systematic bias)。因此,良好的抽樣設計、問卷設計和增加回收率等都是減少偏差的重要步驟。
在抽樣方面,:
─ 是否要用機率樣本(probability sample,亦即random sample)?
─ 抽樣架構(the sampling frame)為何?也就是那些人真正有被抽選到之機會。
─ 樣本之大小(The Sample Size)。
─ 抽樣設計(the sample design),即抽選人或戶之實際策略。
─ 回收率(the rate of response),即真正得到資料者在選取樣本中之比例。
樣本之選取的三個關鍵
─ 得到樣本時所用之the sample frame(樣本架構)。
─ 樣本內每一單位或個案都必須是用機率抽樣之程序,獲得每一個單位都應知道被選取之機率為何。
─ 抽樣設計之細節,如樣本大小,及抽樣程序等,都會影響到樣本之代表性。
The Sample Frame
任何一個選擇樣本之程序都會給一些人被選入樣本之機會,the sample frame 。
─ 抽樣方法可以歸成三大類:
抽樣是由一相當完整的名單中抽出樣本。
抽樣是由一群因做某些事或到某些地方的人中抽出樣本。
抽樣是透過幾個階段抽到樣本。
─ 不論抽樣方法為何,the sample frame 之三個特徵:
包含性(comprehensiveness)與變異性(variation)。
樣本中每一個人或單位都有已知之被選擇的機率。
最後一個評估的標準是抽樣設計之效率(efficiency)。這標準主要牽涉到抽樣所需之成本效益的問題。
由於樣本推論之範圍限於the sample frame,因此研究者要報告什麼人有機會被選擇,什麼人被排在外,那些被排在外的是否有獨特之性質,以及是否有些被抽選者其被抽選之機率不明等。
一個階段的抽樣
─ 簡單隨機抽樣:將抽樣架構中所有的元素編號後,再用一組亂數決定挑選哪些元素。
─ 系統抽樣:將抽樣架構中每一個元素編號,但不用亂數選取,而是依照一定的抽樣間距。
─ 分層抽樣:將母群體分成幾個次母群體(subpopulation)的分層(strata)後,從每個次母群體中抽出一定比例的隨機樣本。
多階段抽樣
─ 由學校中抽選學生
─ 區域機率抽樣(Area Probability Sampling)
─ 隨機數字撥號(random-digit dialing)
樣本推估及抽樣誤差
一般來說,,(您還記得the central limit theorem嗎?)
以下所談之原則雖是運用在所有的sample statistics,但是一般的estimates主要是means(平均數)。最常用來描述抽樣誤差之統計值即為標準誤差(standard error),透過標準誤差我們可以計算信賴區間。
平均數之standard error 為 , Var為樣本之變異量;
比例之SE為 , p (1-p)
由以上公式可看出:
─ 樣本愈大,則抽樣誤差愈小。
─ 當原來樣本數小時,加大樣本數,會減少較多之誤差,但原樣本頗大時,
─ 當p = 0.5時,比例之抽樣誤差最大。
─ 上述之公式只用在simple random sample之情況。當抽樣不是簡單隨機時,
─ 上述之標準誤差只和抽樣之過程有關,並非涵蓋所有其它調查過程中所產生之別種誤差(如個別受訪者可能造成之誤差)。
樣本大小之決定
樣本大小的決定是看:
─ 信賴區間的大小,也就是容許type I error或α的大小(如α = 0.05)
─ 希望利用樣本值在推估母數時能有的精確程度
─ 對一些母數最合理的猜測
例如以是否投給某位候選人的調查為例,因答項只有兩個(是或否),而以推估回答「是」之比例(p)的精確度(如在±0.03),且在95%信賴區間的條件下來決定樣本大小:
則我們希望p ±0.03;此0.03和95%信賴區間的關係是:
p ±0.03 p ±1.96
也就是 0.03 = 1.96
既然最大時為p = 0.5時,最保守的
文档评论(0)