- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多阶段集群抽样
抽樣法 蔡佳泓 政大選舉研究中心 副研究員 課程目標 抽樣原理 非隨機抽樣 隨機抽樣 等距抽樣 分層隨機抽樣 多階段集群抽樣 抽樣原理 由於我們不可能訪問母體中所有的個體,所以必須進行抽樣。 例: 台灣地區七歲到十二歲的小孩在除夕夜平均每人收了多少壓歲錢? 石門水庫管理當局想要知道到底水庫裡有多少魚 ? 非隨機抽樣(1) 偶遇樣本(haphazard sample)或便利抽樣(convenient sample),碰到誰就選誰的抽樣,做研究的人並不在乎調查對象是否有代表性,例如生物學家解剖青蛙,心理學家觀察人們對聲光刺激的反應,醫生徵求自願者做藥物反應的實驗等等。 配額抽樣(quota sampling)依照母體的人口特徵按比例分配樣本數,在配額之內進行非機率抽樣,也就是把調查對象依照特徵分類後,根據各類別的百分比每類立意選樣至額滿為止。 非隨機抽樣(2) 立意選樣(purposive sampling)或判斷選樣(judgment sampling),這是經由專家主觀判斷,立意選定他們認為「有代表性」的樣本來觀察。 雪球抽樣(snowballed sample)先找到原始受訪者,然後再從受訪者所提供的資訊找到其他受訪者。 抽樣的推論 主要想知道母體的平均值跟離散程度(變異數或標準差) 抽樣原理(1) 當我們做無數次抽樣之後,所得到的每一個樣本平均值將形成一個常態分布。而這些樣本平均值的離散程度就是樣本標準差=σ /sqrt(n) 。 如果樣本抽的次數夠多,真正的母體平均值μ應該等於所有樣本平均值的平均值加減一定的標準差。 但是我們不可能抽無限次的樣本,只能假定單一抽樣就代表無限次抽樣後的平均值。因此我們對母體平均值的估計就是依照抽樣結果。 抽樣原理(2) 根據上圖,我們知道,68%的樣本平均值會落在μ加減一個標準差的範圍中。如果是μ加減兩個標準差的範圍,則會包含95%的樣本平均值。如果是μ加減三個標準差的範圍,則會包含99%的樣本平均值。 換句話說,68%的樣本平均值加減一個標準差會包含μ 。以此類推。 抽樣誤差 抽樣一定會有誤差,也就是根據樣本的調查結果跟真實母體之間有一定的差距,稱為抽樣誤差。 抽樣誤差代表一種區間,也就是樣本估計的結果被包含在一定的上下限。 抽樣誤差(1) 因為在二次分布,抽到某一樣本的機率為sqrt[p(1-p)/n], 而p=0.5時, 機率最大,所以一個簡化的抽樣誤差公式可假定σ 等於0.5 ,2個標準差的抽樣誤差即為2*sqrt[0.5*0.5/n]. 也就是-- 抽樣誤差(2) 因為我們知道全部樣本的最小跟最大之間有6個標準差,所以先假設最小值a跟最大值b, σ =(b-a)/6, 反推得n 例: 身高最矮假定為145cm, 最高205cm, σ=(205-145)/6 = 10 . 若希望2σ/sqrt(n) = 0.5cm, 則代入σ得20/sqrt(n)=0.5, n=1600. 信賴水準與抽樣誤差 剛剛提到的68%或95%或99%通常稱為信賴水準。意思為抽100次樣本, 有多少比率的樣本是我們確定會以一個特定區間包含母體平均數μ 。 信心水準越高,所需要的區間也就越大, μ的上下限也就差距越大。所以信賴水準跟抽樣誤差之間必須取捨。通常我們是用95%信賴水準,對應兩個標準差的抽樣誤差 信心水準與抽樣誤差試算 信心水準與抽樣誤差注意事項 上述的公式完全不考慮母體大小,只考慮樣本數大小 。 根據上述的公式可以逆向推估需要的樣本。 當母體非常小的時候, 例如低於100 , 抽樣誤差已經沒有意義,可以考慮全查。 單純隨機抽樣 將每一個觀察值加以編號 依照亂數表選中一個號碼 每個觀察值應該有同樣的中選機率 等距抽樣(1) 把全體總數N除以樣本數n得到K,起始為隨機亂數抽出R,然後每隔K個抽出一個樣本, R, R+K ,R+2K ,R+3K ,一直到R+(n-1)K。 如果觀察值本身有分組, 則是依照各組人數從小而大排列, 然後各組內再編號以方便抽出。 假如我們有4800個觀察值如下表,如何抽出16個樣本? 先抽一個亂數6 ,然後每隔300就抽一個。 等距抽樣(2) 分層隨機抽樣 SRS 先把母群體的所有個體依某些特徵分類,也就是分層,然後在各層之內再進行獨立的隨機抽樣。 按各層佔母體的比例決定樣本數,或是每一層抽同樣的樣本數。 多階段集群抽樣 (1) 主動將樣本分成若干層, 原則為層內同質性越大越好, 層外同質性越小越好。 例如: 依照都市化程度分鄉鎮; 依照學院特性分科系; 依照學校特色分學校 。 人數越多的層應該分到越多樣本(PPS);在各層之下再分段以簡化抽樣。 每一人的中選機率仍然會相同。 多階段集群抽樣 (2) 例如調查政大的學生對政大的認同感。 根據資料,博士班學生約
您可能关注的文档
- 台湾大学层级研究中心现况调查与评鉴可行性研究台湾政治大学教育.doc
- 台湾人寿民营化经验分享与结合北医大未来合作发展契机.ppt
- 台湾通世界-以民间故事为例论本土情与世界性-大同大学通识中心.doc
- 台中市政府人事处4月份宣导事项.ppt
- 可进行减压过滤.ppt
- 各种技法的简介.ppt
- 各院系所电费配额实施办法.doc
- 各项学杂费减免相关Q&A.doc
- 名称-中国极地科学考察管理信息系统.doc
- 吉林大学珠海学院大学生创业孵化基地公共服务场地借用申请表.doc
- springbooot+vue基于java的房屋维修系统毕业论文.doc
- 中国消防救援学院《单片机系统实验》2023-2024学年第一学期期末试卷.doc
- 2025年溧阳纺织化学品项目申请.pptx
- 景区门票包销合同模板(3篇).docx
- 【股票技术指标学习指南】第七章第三节货币需要量的测算.doc
- 2025春 _ 人教版七年级英语下册【unit4】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit5】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit6】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit7】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit8】看音标写单词.doc
文档评论(0)