- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为什么需要统计
統計素養~以抽樣調查為例 國立台北教育大學 數學技資訊教育學系 陳幸玫 統計和數學 統計是數學的一個次領域嗎? 統計只牽涉到數學嗎? 統計除了數學還有什麼? 統計教學只是數學公式的導出和計算嗎? 為什麼需要統計 為了做決定,可是面對的訊息千變萬化… 為了解決不確定的問題… 為了從雜亂無章的訊息中,理出頭緒… …………………. 為了表示有學問,言之有 ”據”… 為了讓我們知道可以偷懶到什麼程度而不至於太離譜… 統計需要什麼 訊息資料 為何需要(why) 從哪裡來(where) 怎麼取得(how) 什麼形式(what) 數學 簡化和呈現數據訊息 機率 量化不確定的程度 描述、分析、推論 用詞遣字是否適當 怎麼描述我們對估計準確程度的信心 用的統計方法是否恰當 相關還是因果 是否有潛在變數或中介變數 該拒絕還是該接受 推論結果合不合理? 道德 數字不會說謊,但說謊的人會想出辦法 (Charles Grosvenor) 訊息資料 為何需要收集資料: 要收集哪些資料 要收集多少資料~~抽樣囉!!! 資料的範圍 資料的定義 從哪裡來的資料 自己收集的資料或現成資料 資料的來源是否來公正客觀 怎麼收集資料 調查 實驗 怎麼用數字表徵資料 名目資料 有序資料 比例資料 連續資料 用數學方法簡化和呈現整體數據 數據計算:平均數、中位數、眾數、變異數、標準差、四分位數、百分位數等等。 數學形式:百分率、成數、折數、整數、小數、分數等等 圖表:一維表格、二維表格、巢狀表格、長條圖、折線圖、圓形圖、意象圖等等。 資料收集的方法 調查:觀察個體並度量我們感興趣的變數,但並不試圖影響回應。研究目的是描述一群體在此變數的反應。 實驗:刻意對某些個體加上某項處理,以期能夠觀察其反應。研究目的是比較不同的處理是否會使個體有不同的反應。 設計實驗~~隨機的精神,控制的手段 隨機抽樣 簡單隨機抽樣(simple random sampling, SRS): 系統抽樣(systematic sampling) 叢聚抽樣(cluster sampling) 分層抽樣(stratified sampling) 非隨機抽樣 方便抽樣 簡單隨機抽樣 母體中任一組包含n個個體的樣本,中選的機率都是一樣的 不偏:每一個個體中選的機會一樣 獨立:一個個體中選與否,不影響其他個體是否中選 分層抽樣 把母體依據特性或研究的目的分成幾個性質相同的類組,每個類組稱為一層,每個個體只能屬於其中且唯一的一層。分層後再從各層中簡單隨機抽取樣本(SRS) 。 層內個體性質差異小,層間性質差異大 可依母體各層個體數目之比例,決定各層樣本數 可依母體各層資料變異之比例,決定各層樣本數 部落抽樣 將母體中相鄰的某些個體劃分成一個部落,每個個體只能屬於其中且唯一的一個部落。然後再從所有部落中隨機抽取數個部落,並對部落內的個體進行普查。 常用在地理區域的抽樣 例如:同一年級中抽取數個班級,對班級內所有學生進行普查。班級為部落單位。 系統抽樣 由母體自然隨機排列的個體中,每隔一定間隔選取一個個體,或者先隨機選取一個個體,然後每隔一定間隔選取一個個體。 樣本可靠嗎? 用樣本來估計母體的某些特徵不但不準確,而且不穩定,因為 樣本只是母體的一部份(產生誤差) 母體中有很多組相同大小的樣本,會抽到哪一組樣本不知道(產生變異) 誤差來源 抽樣誤差:只要是抽樣就會有誤差 非抽樣誤差 偏差:可能來自於抽樣誤差也可能來自於非抽樣誤差 樣本估計值總是大於母體參數值或總是小於母體參數值 隨機抽樣可以降低偏差 變異: 以母體參數值為中心,所有樣本估計值分散的程度 大樣本和適當的估計方法可以降低變異 樣本可靠嗎? 必須面對的現實 人為的操縱可以避免(非抽樣誤差),但是即使是隨機抽樣,仍無法避免因抽樣所產生的變異和誤差 誤差=|樣本估計值-母體參數值|ε 抽樣調查中所報告的誤差界限ε為隨機抽樣誤差 統計的目標:誤差越小越好且母體參數落在此誤差範圍內的可能性越高越好 樣本大小的影響(以簡單隨機抽樣為例) 以民意調查為例,假設母體中同意某議題的人數比例為p ,隨機抽取n個人, 樣本大小的影響(以簡單隨機抽樣為例) 樣本大小的影響(以簡單隨機抽樣為例) 利用期望值和變異數的數學方法和性質,我們可以得到 中央極限定理說:隨機從某一母體中抽取n個個體為樣本,則樣本平均數的變動狀況會越來越趨近於常態分配模型 結論: 樣本越大,樣本比例的變異越小 樣本越大,樣本比例的隨機變動模型越對稱 樣本大小的影響(以簡單隨機抽樣為例) 用樣本估計母體參數有信心嗎?(以簡單隨機抽樣為例) 誤差=|樣本估計值-母體參數值| 在母體參數值未知的情況下,如何描述誤差? 設定誤差界限ε (margin
文档评论(0)