- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
解读信赖区间与信心水准.doc
關於高中統計課程的一些說明
江前佑
目的:
本文的主要目的在於說明信賴區間的計算公式的由來,主要也就是希望能解釋抽樣分佈的標準差的由來,其中p是母體的成功比例,n是抽樣樣本的大小,並從中說明信賴區間與信心水準的意義。
前言:
當一個社會議題形成時,為瞭解社會大眾對此議題的認知時,在爭取時效及成本限制下,常使用的辦法是進行抽樣調查。
以台北市長候選人的支持度為例,假設某一個電視台想知道所有的台北市民是否支持某一個候選人(把此候選人稱作甲),最為準確的方法是調查所有有投票權的台北市民(稱為母群體),把表示支持的人數除以所有願意投票的投票人口即為真正的支持度,當然我們不去考慮民眾在接受調查的情況下不誠實的情況,然而,這樣的調查方法在時效與成本的考量上難以辦到,要耗費過多的人力、資源和時間,因此我們使用隨機抽樣的方式,希望從有投票權的台北市民中抽出幾個人(稱為樣本),從這幾個人的支持情況來推估所有的人的支持情況。其中隨機樣本是極為重要的,因為這才具有代表性,從樣本推母體背後的依據也基於隨機樣本的假設。
假設現在訪問了1000位台北市民,其中有501為表示支持甲候選人,我們希望即可代表甲候選人的支持度,但是很清楚的這是不可能的,因為這僅僅代表了這1000人的支持度而已。這樣的估計方式稱為點估計(point estimate),會產生誤差。另一種在報章雜誌上常見方式稱為區間估計(interval estimate),信賴區間即是一種區間估計。
計算方法:
……
這次民意調查於三月十日至十二日進行,總共訪問了一千零一名成人,百分之九十五的信心水準位95%的信心「95%的信心」考慮對於一個議題的看法只有,把這項特質稱為成功,則母群體中的成功比例是p(具有成功特質的個數 / 母群體總數)。計算出來,其中n是從母體中抽取樣本的大小,問題是由前言我們已經知道p難以測量,因此我們用隨機樣本中的成功比例(樣本中成功的個數 / 樣本總數)來估計p:
給定95%的信心水準信賴區間是由計算得知,誤差加減三個百分點是由計算出來。如果是99%的信心水準只要把1.96換成2.58即可。
F是S所有子集形成的集合,以及P是一個自F到R(實數)的函數:
P:F,。
(全事件必然發生)。
若則(互斥事件的加法性)
則稱P為S上的機率函數,對於每個,叫做事件A的機率,一個樣本空間S連同一個機率函數P,合稱為一個機率空間,記做(S,P)。
定義:(隨機變數)
設(S,P)是機率空間,一個隨機變數X就是樣本空間S上的一個實數值函數:
X:SR
令,對一任意實數考慮下列集合。如果,則此為空集合,表示為空事件;,則此為非空集合,表示為S中的一個非空事件,簡寫為,表示此事件的機率就直接寫成。
舉例來說,投擲一枚公正硬幣2次,樣本空間S={(正正),(正反),(反正),(反反)},P依照古典機率的定義每一個樣本空間中各基本事件出現的機會均等,定義P(正正)=P(正反)=P(反正)=P(反反)=1/4,則可以檢查P的性質得知(S,P)是一個機率空間。我們可於其上定義隨機變數X=出現正面的總數,則。
或是定義隨機變數,則。
隨機變數將樣本空間變換為實數,使我們能夠將樣本空間上的機率也轉換為實數上的機率,來討論分佈的情形。
定義:(機率密度函數)
設(S,P)為機率空間,X為隨機變數,定義函數
,。
叫做隨機變數X的機率密度函數,或簡稱為機率函數。
經過以上的定義,我們可以開始考慮與主題相關的伯努利(Bernoulli)分佈,及二項分佈。
伯努利分佈:
此一類型中樣本空間只有兩個點,假設,;,則X之機率函數為。舉例來說,如:投擲公正的硬幣、產品的不合格比率、棒球的打擊率均屬於此一類型。這種只考慮有兩個可能結果,一為成功,一為失敗的試驗就稱為伯努利試驗。
II.二項分佈:
將伯努利試驗重複n次,a出現的次數X的機率函數為(設p、q,k=0,1,2,……,n,
由於恰為二項展開式的一般項,因此稱X之機率分佈為二項分佈。此外由二項式定理知:,合乎全機率為1的要求。
定義:(期望值)
設(S,P)為機率空間,X為隨機變數,為X的機率函數,。定義,叫做X的期望值,也記做。
由隨機變數及期望值的定義,我們可推得一些性質。(證明可參考六十年間高中數學實驗教材第五冊第五章)
(a)若(常數),則
(b)設為隨機變數,則合函數亦為一隨機變數(稱為隨機變數的和)而且我們有
(c)設X為隨機變數,a為任意實數,因為(aX)(x)=a(X(x)),所以aX也是一個隨機變數,且,。
(d)設X和YXY(x)=X(x)Y(x),所以XY也是一個隨機變數。而且有E(XY)=E(X)E(Y)。
以上的性質將幫助我們處理關於方差的計算,現在我們先經由期望值的定義來計算二項分佈中隨機變數X的期望值。使用同I.II介紹伯努
文档评论(0)