超幾何分布的最大概度估計值.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
超幾何分布的最大概度估計值

超幾何分布的最大概度估計值 李政豐 國立竹南高中數學科教師 摘要: 1. 最大概度估計法(maximum-likelihood estimate)與超幾何分配的相關概念。 2. 超幾何分配的點估計在中學數學的教學實例。 引言 由一個常見的中學機率問題談起: 例題1:若要估計明德水庫大頭鰱的總數量(sn),我們先捕捉200條大頭鰱(若捉到其他魚種就放生不算,且假設每條大頭鰱被捉到的機會均等),將200條大頭鰱作上記號再放回水庫(m=200),過了幾天讓各魚群充分混合之後(或許需要更長的時間),再由水庫中捕捉100條(n=100)大頭鰱,若發現其中有10條(i =10)有作標記,於是估計亦即 (sn表明德水庫中大頭鰱的估計數量),得到sn=2000。 這種先捕捉,作記號,放回,再捕捉的試驗。則這個再捕捉到的大頭鰱中帶有記號的條數,在統計學中是屬於哪一種分配,它相關的概念為何,用到了哪一個估計的方法。這是我們想要討論研究的目標。 定理與推論 我們以取球的試驗,利用Geogebra、Excel VBA動態模擬的特性,作輔助探討。假設箱中有球,總數量為sn其中紅球數為m非紅球數為(sn-m)從箱中隨機任取n個球出來,,, 表示取出的n個球中恰有i個紅球之機率。這是一個超幾何分布的範例,我們必須先了解超幾何分布的基本統計量與性質。 引理(1) :. 引理(2) :. 定理(一)超幾何分布的期望值= (若) : (利用引理(1)及引理(2)) = (令) 其中 可以看成是總球數(sn-1)其中紅球數(m-1)從中取出(n-1)個球之超幾何分布的機率總和,故. 最大概度估計法(MLE)模擬實驗的情境: 假設箱中有球,總數量sn為未知,其中紅球數m是已知,非紅球數(sn-m)為未知,從箱中隨機任取n個球出來,n是已知,取出紅球的個數i也是已知,, 表示取出的n個球中恰有i個紅球之機率。 當m=30, n=16, i =8已知的條件下,當sn逐漸增加,大小的變化為何? 下圖(一)中的綠點它的x坐標是球的總數sn而它的y坐標是機率質量函數的值。 圖(一) 觀察上圖(一),的值先漸增而後漸減,大約在sn=60有最大值。於是我們想觀察漸增的條件: 首先考慮的情況 亦即 的情況,當sn漸增,也逐漸增加,在時,有最大值。 也就是時,有最大值。 在超幾何分布,假設: (a)總球數sn未知。 (b)紅球數m、取球數n、以及n球中取得的紅球數 i 三數皆為已知。 在上面(a)(b)兩條件下,我們將有最大值的情況,以不同的敘述列出如下: (1) 時,隨sn增加而漸增,在時,有最大值。 (2)在取得n球中的紅球數等於超幾何分布的期望值,即(若)時,有最大值。 (3)總球數中的紅球比率,等於取球數中的紅球比率,即時,有最大值。 當我們以有最大值的情況下求得的sn, 作為總球數的估計值。就稱為最大概度估計法(maximum-likelihood estimate)。 我們再以二項分布與超幾何分布期望值相同的性質,以一個例題來討論並解釋我們通常使用這個估計法的情形。 例題2:若要估計水庫裡吳郭魚的總數量(sn),我們先捕捉500條吳郭魚(若捉到其他魚種就放生不算,且假設每條吳郭魚被捉到的機會均等),將500條吳郭魚作上記號再放回水庫(m=500),過了許多天,讓魚群充分混合之後,再由水庫中捕捉1000條吳郭魚(n=1000),若發現其中有5條(i =5)有作標記,請問水庫裡的吳郭魚總數大概有多少?我們通常是直觀的估計比例相同亦即 (sn表水庫中吳郭魚的估計總數量),得到sn=100000 這個例子,原本是超幾何分布,每次捕吳郭魚不是獨立事件(在捕1000條吳郭魚的過程,同一條魚不會被捕兩次),但是超幾何分布與二項分布的期望值相同,都是np其中n=1000是第二次捕魚的數量,表做記號的魚數量m佔全部吳郭魚sn的比例。藉由期望值, 得到sn=100000 而且當被做記號的吳郭魚數量m以及取樣數n=1000,都遠比吳郭魚總數sn少很多時(統計學家認為至少要10倍以上),在捕1000條吳郭魚的過程,每次捕到有作記號吳郭魚的事件,幾乎接近獨立事件;而且超幾何分布的圖形也會接近二項分布。 例如:A表第一次捕到有作記號的吳郭魚,B表第二次捕到有作記號的吳郭魚。則由超幾何分布. 如果是二項分布,捕捉後又再放回,每次捕捉到有記號的吳郭魚都是獨立事件,, 兩者機率相差甚小。 這個生物統計的實驗示例,在國中七年級數學第二冊的比與比例就很常出現,我們卻很少去了解其中的緣由,常以為是二項分布,殊為可惜。 討論 我們以最大概度估計法,估計明德水庫的大頭鰱總數為例: (1)估計法必須有一定的準確度,才算是好的估計。 (2)做記號的大頭鰱數目m不可太少,要佔總數sn的顯著比率,否則準確度不高

文档评论(0)

busuanzi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档