104分层抽样.PPT

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
104分层抽样

10.1 隨機抽樣 母體: 有限母體 無限母體?---元素的數量在理論上是無限多個 (a) (b) 隨機抽樣 利用計算機產生四位數的亂數,我們只取前三位。略去000、大於138的數字,以及已經被選到的數字,假設我們得到了041、021、079、084、012、108、029、003、100、046、126、與075。這12個編號就是我們要挖掘的地點。 ? 略去000以及大於138的數字,並確保已經被選到的數字不會被重複選取 得到的樣本為007、012、031、135、114、120、047、124、070、009、118,與094。 要挖掘的考古地點為編號7、12、31、135、114、120、47、124、70、9、118,與94。 ? 隨機抽樣 定義 (無限母體): ? 從無限母體中抽選出樣本數為 n 的樣本時,若該樣本是由獨立隨機變數的值所組成,且這些獨立隨機變數服從相同的機率分配,則稱為隨機樣本。 投擲一個骰子12次,得到 2、5、1、3、6、4、4、5、2、4、1、2 八個學生測量某矽化合物的沸點: 136、153、170、148、157、152、143、150。 *10.2 抽樣設計 比隨機抽樣更好的抽樣方法 更容易取得樣本資料、成本更低、或是能獲得更多的資訊 抽樣設計是個相當明確的計畫,在開始抽樣或收集資料之前就必須定案。 *10.3 系統抽樣 每隔幾個項目抽一個 的方法稱為系統抽樣 最實際的抽樣方式 系統抽樣所涵蓋的範圍可能比較平均。 不利因素:母體當中可能有未知的週期性。 *10.4 分層抽樣 分層(簡單)隨機抽樣 1.把母體區分成幾個彼此不重複的子區域,稱為層 2.從每一層中採取隨機的方法抽樣叫做分層抽樣 樣本數的決定 比例分配、最佳分配 比例分配 各層所抽選的樣本數,與該層的大小成正比。 最佳分配 考量到各層內部各自的變異性 交叉分層:根據母體的不同特徵,採用多面向分層 配額抽樣:分層抽樣中,採訪具備哪幾種特徵的人、每種的人數。 *10.5 叢聚抽樣 定義: 1. 將整個母體細分成幾個更小的子群體 2. 從這些子群體中隨機選出幾個做為樣本。 子群體是根據地理區域來劃分的話,稱為地區抽樣。 10.6 抽樣分配 樣本平均數、樣本中位數,以及樣本標準差的數 值會隨著樣本不同而出現差異,都是隨機變數。 它們的分配稱為抽樣分配(sampling distribution) N=5 的母體中,選出兩個當樣本 抽樣分配中平均數與標準差 是 的抽樣分配的平均數,其值等於母體平均數 ; ? 是 的抽樣分配的標準差,其值小於母體標準差 。 電腦模擬 10.7 平均數的標準誤 樣本平均數的抽樣分配的平均數: ? 樣本平均數的抽樣分配的標準差: 稱為平均數的標準誤 (a) 兩個標準誤的比率為 ?1/2 ? 樣本數變成原來的四倍,標準誤變小一半。 ? (b) 兩個標準誤的比率為 3? 樣本數變成原來的九分之一,標準誤變大三倍。 ? 有限母體修正項 除非樣本數超過母體大小的百分之五,不然這個修正項通常是忽略不計的 N=10000 , n=100 代入,得到0.995 ? ? 這個值非常接近1,所以在實際應用上,可以忽略不計。 ? 將 N=5、n=2 ,σ代入的第二個公式 將N =1,000、n=15、σ=288.67代入 的第二個公式,得到 10.8 中央極限定理 中央極限定理 從平均數為μ且標準差為σ的無限母體中選出一個樣本數為 n 的隨機樣本,則 z 近似於標準常態分配。 機率值介於-2以及 2之間的面積 表 I 得知,z=2 時的對應值為0.4772 機率值為0.4772 + 0.4772=0.9544。 10.9 其他方面的問題 中位數的標準誤大約是 當我們要估計某左右對稱的母體平均值時, 很明顯樣本平均數要比樣本中位數可靠多了 ,因為樣本平均數所可能產生的誤差比較小。 ? 把上述兩個標準誤的公式以等號連接,並在中位數標準誤那邊代入 n=200,解得 n=128。 n=128 的樣本平均數和 n=200的樣本中位數一樣的「好」。 ? * 方法:由電腦或計算機產生亂數 有限母體修正項 將 n=64 與σ=20 代入平均數的標準誤的公式中,? ? ,1-1/22 = 0.75 至少有 75% 的機

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档