统计学-吴统雄.PDF

下载文档 降价啦

19
0
约7.27千字
约 8页
2018-10-26 发布于天津
举报
版权申诉
保障服务

统计学-吴统雄.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

统计学-吴统雄

一、樣本代表性「樣本代表性」是行為科學界內通行的一個抽象概念，意指抽樣調查的數據是否正確，也正由於此一語彙的抽象性，有些研究者常以研究經驗或批判洞察力來判斷其代表性，較缺乏具體衡量的準則。「樣本代表性」應有兩類意義，第一類是「統計學、計量分析思想」的意義。第二類，是「應用統計、抽樣實務」的意義。二、統計學、計量分析思想的樣本代表性一般的數學、即 Euclid -Newton 數學，若能發揮測量與預測能力，其對象必須具備「反身性、等加性」，吳統雄特命名為「第1類計量思想」產生的是「第1類知識」。但生命現象、行為現象，並不具備「反身性、等加性」，倒是可能具備「常態分配」性質，故 Pearson, Fisher 等人開拓了「推論統計學」、原稱「生物統計」方法，吳統雄特命名為「第2 類計量思想」產生的是「第2類知識」。統計學有兩種容易混淆的目的，一種是收集到資料樣本後，測量與報告的統計值，只「限於觀察樣本的本身」，稱為「敘述統計」，沒有推論全體的基礎與價值。 1 第二種則是要「從樣本『推論』母群（注）」，即預測「全體」的現象，而以樣本為代表，是為「推論統計學」。如果要「推論」，就是要能「以簡馭繁」，以小樣本觀察、預測母群；但又必須「具體而微」，應有適當的樣本代表性。而推論的樣本代表性，來自2 個基本觀念：常態分配、與中央極限定理。 (一常態分配) 生物界的大多數特質，樣本之間都會呈現常態分配-亦即如下圖般：左右對稱的鐘型曲線。底部 X 軸表示標準差(Z) 。Y 值就是觀察特徵值X 值對應的樣本數。 1 (注 ) 「母群」(population)即受調查的全體，不少中文書譯為「母體」，如果翻譯除了「信達」之外，也有「求雅」的必要，本研究者建議採用「母群」之譯文。登錄樣本的文件或虛擬架構即為母群清冊，又稱為抽樣對象（sample framework, 或sampling frame ）。 - 1- 函數曲線所覆蓋的面積，就是總樣本數。底部﹦號後的數值，為其垂直範圍占總樣本數的百分比(P) ，如正負1個標準差內的草數佔全體68.26% 。 Probability= 範圍內樣本數，占母群的百分比。 Standard Deviations= 標準差，亦稱離均差。 Z Scores= Z 分數，就是有幾個標準差，兩者其實相同。常用Z 值有2 和2.5 。當Z= 2 ，單側P= .4772 ，左右合計為 P ≒ .95 ，即95% 的樣本，在2 個標準差之內。當Z= 2.5 ，單側P= .4938 ，左右合計為 P ≒ .99 ，即99% 的樣本，在2.5個標準差之內。常態分配有很多深入的啟示，其中1項就是：不要把形象表面的差距，誤以為是真實的差距！進一步解說，請參考：統雄-統計神掌機率與分配。 (二中央極限定理。) 中央極限定理是推論統計的基礎。機率的估計值必須在「大數法則」下，才會實現；同時在「大數」時，觀察樣本會呈現「中央極限」現象，這就是我們解釋推論統計的基礎。中央極限定理(Central limit theorem)係指從平均數為μ ，標準差為σ 的母群中，隨機/ 等機率地抽取大小為n 的獨立樣本。當樣本數很大 -2 - 時，其樣本平均數減掉母群平均數、再除以樣本標準差（特稱為標準誤），將會趨近平均數為0 ，標準差為1的常態分配。也就是說：所有樣本平均數的集合，會形成一個「虛擬的」「樣本平均數分配的常態分配」。其定義公式為：平均數標準差觀察對象,樣本