抽样设计.docVIP

下载本文档

19
0
约3.62千字
约 6页
2017-02-15 发布于天津
举报
版权申诉

抽样设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

抽样设计

抽樣設計一些大原則： ─ 認定能夠實際接觸到的母群體，也就是抽樣架構（sampling frame）。 ─ 避免隨意抽樣（亦即非機率性的抽樣）。 ─ 理想上是能做簡單隨機抽樣或系統抽樣。 ─ 分層抽樣可以減少抽樣誤差。 ─ 當母群體中每一位被抽樣的對象是分屬於某一團體時，則可考慮用隨機叢集抽樣（cluster sampling）。 ─ 當母群體很大時，應考慮用多階段抽樣。 ─ 決定樣本的大小是以推估母數（parameter）時所欲達到之精準度為基礎。 ─ 大樣本並不能補償抽樣時的偏差或系統性偏差（sampling bias；systematic bias）。因此，良好的抽樣設計、問卷設計和增加回收率等都是減少偏差的重要步驟。在抽樣方面，: ─ 是否要用機率樣本（probability sample，亦即random sample）？ ─ 抽樣架構(the sampling frame)為何？也就是那些人真正有被抽選到之機會。 ─ 樣本之大小(The Sample Size)。 ─ 抽樣設計(the sample design)，即抽選人或戶之實際策略。 ─ 回收率(the rate of response)，即真正得到資料者在選取樣本中之比例。樣本之選取的三個關鍵 ─ 得到樣本時所用之the sample frame(樣本架構)。 ─ 樣本內每一單位或個案都必須是用機率抽樣之程序，獲得每一個單位都應知道被選取之機率為何。 ─ 抽樣設計之細節，如樣本大小，及抽樣程序等，都會影響到樣本之代表性。 The Sample Frame 任何一個選擇樣本之程序都會給一些人被選入樣本之機會，the sample frame 。 ─ 抽樣方法可以歸成三大類: 抽樣是由一相當完整的名單中抽出樣本。抽樣是由一群因做某些事或到某些地方的人中抽出樣本。抽樣是透過幾個階段抽到樣本。 ─ 不論抽樣方法為何，the sample frame 之三個特徵: 包含性(comprehensiveness)與變異性（variation）。樣本中每一個人或單位都有已知之被選擇的機率。最後一個評估的標準是抽樣設計之效率(efficiency)。這標準主要牽涉到抽樣所需之成本效益的問題。由於樣本推論之範圍限於the sample frame，因此研究者要報告什麼人有機會被選擇，什麼人被排在外，那些被排在外的是否有獨特之性質，以及是否有些被抽選者其被抽選之機率不明等。一個階段的抽樣 ─ 簡單隨機抽樣：將抽樣架構中所有的元素編號後，再用一組亂數決定挑選哪些元素。 ─ 系統抽樣：將抽樣架構中每一個元素編號，但不用亂數選取，而是依照一定的抽樣間距。 ─ 分層抽樣：將母群體分成幾個次母群體（subpopulation）的分層（strata）後，從每個次母群體中抽出一定比例的隨機樣本。多階段抽樣 ─ 由學校中抽選學生 ─ 區域機率抽樣(Area Probability Sampling) ─ 隨機數字撥號(random-digit dialing) 樣本推估及抽樣誤差一般來說，，(您還記得the central limit theorem嗎?) 以下所談之原則雖是運用在所有的sample statistics，但是一般的estimates主要是means（平均數）。最常用來描述抽樣誤差之統計值即為標準誤差(standard error)，透過標準誤差我們可以計算信賴區間。平均數之standard error 為， Var為樣本之變異量；比例之SE為， p (1-p) 由以上公式可看出: ─ 樣本愈大，則抽樣誤差愈小。 ─ 當原來樣本數小時，加大樣本數，會減少較多之誤差，但原樣本頗大時， ─ 當p = 0.5時，比例之抽樣誤差最大。 ─ 上述之公式只用在simple random sample之情況。當抽樣不是簡單隨機時， ─ 上述之標準誤差只和抽樣之過程有關，並非涵蓋所有其它調查過程中所產生之別種誤差(如個別受訪者可能造成之誤差)。樣本大小之決定樣本大小的決定是看： ─ 信賴區間的大小，也就是容許type I error或α的大小（如α = 0.05） ─ 希望利用樣本值在推估母數時能有的精確程度 ─ 對一些母數最合理的猜測例如以是否投給某位候選人的調查為例，因答項只有兩個（是或否），而以推估回答「是」之比例（p）的精確度（如在±0.03），且在95％信賴區間的條件下來決定樣本大小：則我們希望p ±0.03；此0.03和95％信賴區間的關係是： p ±0.03 p ±1.96 也就是 0.03 = 1.96 既然最大時為p = 0.5時，最保守的