- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
叙述统计和抽样分布
PAGE
PAGE 126
第四章 敘述統計與抽樣分佈
4.1 母群體與樣本
在第二、第三章我們討論隨機變數的分佈時,我們是已知其分佈之參數數值,而根據其機率函數或機率密度函數計算某些事件的機率。例如:某甲競選班長,若知該班40位同學有24位同學支持他,支持他的比例p為,若我們從該班同學中有退還隨機抽取5位同學,則這5位同學中支持甲的人數的分佈為,故其機率可由下式求得:
。
但如果不知道比例,那要如何估計它呢? 若只有40位學生,我們可逐一問其是否支持甲就可以得到答案。但較大的選舉,選民可能有幾拾萬,幾百萬,甚至上千萬,則由於時間或人力等客觀條件的限制,使得從事逐一遍查的普查(census)工作變得不切實際,甚或不可能。這時只得從選民中取一小部份,而根據這一小部份人提供的資訊去猜測某候選人得票的比例p。
在上述例子中,我們探討的問題的所有對象為全體選民,稱為一個母群體(population),就是機率模型的樣本空間。從他們當中經由一恰當的隨機方法取得一小部份,這過程稱為隨機取樣(random sampling),從取得的樣本(sample)所獲得的資料去推論母群體的某種特徵,如上例中的p,稱為統計推理(statistical inference)。
母群體是某實驗或研究所探討的所有對象個體所組成的集合。 若母群體的成員只有有限個而可一一列舉,我們稱這母群體為有限母群體(finite population),若母群體的成員個數為無限時,則我們稱為無限母群體(infinite population)。有些母群體在我們取樣時,其部份成員尚未存在,這是一種抽象型母群體(conceptual population),我們將之歸類到無限母群體。
例題4.1.1 (a)台北市的選民是一個有限母群體
(b)7-11今天進貨的100瓶鮮乳是一有限母群體
(c)中興湖裡的魚是一有限母群體
(d)某品牌燈泡的生命長度其母群體為,故為一無限母群體
(e)一家藥廠研發出一種新的降血壓藥,該藥廠希望知道這藥對高血壓的療效。這問題的研究對象為所有高血壓患者。 因為它除了包括現在有高血壓的人之外,還包括將來有高血壓的人。 這是一個抽象型母群體,因做實驗時,母群體有些成員(將來患高血壓的人)尚未存在。我們把它當作無限母群體。
固然有些時候我們的興趣是母群體的成員,但大部份的問題中,我們的興趣不是母群體成員本身,而是他們的一些特徵,例如:
例題4.1.2 承例題4.1.1(a)台北市選民的投票對象。
(b)鮮乳有沒有變壞。
(c)假定中興湖裡的魚有一部份有記號,撈起的魚身上有或沒有記號。
(d)燈泡的生命長度。
(e)用藥後病人血壓有沒有降低。
若我們給母群體的每一個成員設定一數(數值或代號),即可在母群體上定義一母群體變數(population variable,如第二章介紹的的隨機變數)。往後在不會混淆的情況下,我們將以數取代其對應之成員。
例題4.1.3 承例題4.1.2 (a)依要投給候選人甲、乙或丙,我們分別給市民代號1,2或3。
(b)好的鮮乳給它代號1,變壞的給它代號0。
(c)有記號的魚給它代號1,沒有記號的魚給它代號0。
(d)燈泡的生命長度(母群體成員即為探討對象)。
(e)用藥後病人血壓降低的幅度。
例題4.1.3(a)(b)(c)的母群體變數為一類別變數(qualitative or attribute or categorical variable),它將母群體成員分類,(d)(e)的母群體變數為一數值變數(quantitative or numerical variable)。
至於參數(parameter)則是一個總結母群體變數某些特徵的數值。它常常是未知而有待估計的常數,例如:
例題4.1.4 承例題4.1.3各子題之參數可為:
(a)代號為1,2,3的市民比例為三個參數。
(b)代號為1的比例為一個參數。
(c)湖裡魚的總數為一個參數。
(d)燈泡生命長度的期望值與變異數為兩個參數。
(e)服用該藥的病人血壓降低量的平均值為一個參數。
當母群體確定後,為了探討母群體的某些特徵數值(參數),在不適合做普查的情況下,我們可從母群體中適當的取得其中一小部分成員做為樣本,根據樣本的資料來推論母群體的特徵值。 要適當的取得樣本我們必須先建立一個抽樣底冊(sampling frame)。抽樣底冊必須包含母群體的每一個成員,讓母群體的成員都有機會被抽出。 例如要從中興大學學生取樣,註冊組的學生名冊是一個抽樣底冊。 若母群體為台中市選民,則戶政事務所的選舉人名冊是一抽樣底冊。 雖然很多傳播媒體常用電話號碼簿作為抽樣底冊,但它並不是一個很好的抽樣底冊,因為有很多選舉人不被列在電話號碼簿上。
有了抽樣底冊,下一步就是如何取樣。既然我們的目的
文档评论(0)