统计学-吴统雄.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学-吴统雄

一、樣本代表性 「樣本代表性」是行為科學界內通行的一個抽象概念,意指抽樣 調查的數據是否正確,也正由於此一語彙的抽象性,有些研究者常以 研究經驗或批判洞察力來判斷其代表性,較缺乏具體衡量的準則。 「樣本代表性」應有兩類意義,第一類是「統計學、計量分析思 想」的意義。 第二類,是「應用統計、抽樣實務」的意義。 二、統計學 、計量分析思想的樣本代表性 一般的數學 、即 Euclid -Newton 數學 ,若能發揮測量與預測能 力,其對象必須具備「反身性、等加性」,吳統雄特命名為「第1類計 量思想」產生的是「第1類知識」。 但生命現象、行為現象,並不具備「反身性、等加性」,倒是可 能具備「常態分配」性質,故 Pearson, Fisher 等人開拓了 「推論統計 學」 、原稱「生物統計」方法,吳統雄特命名為「第2 類計量思想」產 生的是「第2類知識」。 統計學有兩種容易混淆的目的,一種是收集到資料樣本後 ,測量 與報告的統計值,只 「限於觀察樣本的本身」,稱為「敘述統計」, 沒有推論全體的基礎與價值。 1 第二種則是要「從樣本『推論』母群(注 )」 ,即預測「全體」 的現象,而以樣本為代表,是為 「推論統計學」。 如果要「推論」,就是要能「以簡馭繁」,以小樣本觀察、預測 母群;但又必須「具體而微」,應有適當的樣本代表性。 而推論的樣本代表性,來自2 個基本觀念:常態分配、與中央極限 定理。 (一常態分配) 生物界的大多數特質,樣本之間都會呈現常態分配-亦即如下圖 般:左右對稱的鐘型曲線。 底部 X 軸表示標準差(Z) 。Y 值就是觀察特徵值X 值對應的樣本 數。 1 (注 ) 「母群」(population)即受調查的全體,不少中文書譯為「母體」,如 果翻譯除了「信達」之外,也有「求雅」的必要,本研究者建議採用「母群」之譯 文。登錄樣本的文件或虛擬架構即為母群清冊,又稱為抽樣對象(sample framework, 或sampling frame )。 - 1- 函數曲線所覆蓋的面積,就是總樣本數。 底部﹦號後的數值,為其垂直範圍占總樣本數的百分比(P) ,如正 負1個標準差內的草數佔全體68.26% 。 Probability= 範圍內樣本數,占母群的百分比 。 Standard Deviations= 標準差,亦稱離均差 。 Z Scores= Z 分數 ,就是有幾個標準差,兩者其實相同。 常用Z 值有2 和2.5 。 當Z= 2 ,單側P= .4772 ,左右合計為 P ≒ .95 ,即95% 的樣本,在2 個標準差之內。 當Z= 2.5 ,單側P= .4938 ,左右合計為 P ≒ .99 ,即99% 的樣本, 在2.5個標準差之內。 常態分配有很多深入的啟示,其中1項就是:不要把形象表面的差 距,誤以為是真實的差距! 進一步解說,請參考:統雄-統計神掌機率與分配 。 (二中央極限定理。) 中央極限定理是推論統計的基礎 。 機率的估計值必須在「大數法則」下,才會實現;同時在「大 數」時,觀察樣本會呈現「中央極限」現象,這就是我們解釋推論統 計的基礎。 中央極限定理(Central limit theorem)係指從平均數為μ ,標準差為σ 的母群中,隨機/ 等機率地抽取大小為n 的獨立樣本。當樣本數很大 -2 - 時,其樣本平均數 減掉母群平均數、再除以樣本標準差(特稱為標準 誤),將會趨近平均數為0 ,標準差為1的常態分配。 也就是說:所有樣本平均數的集合,會形成一個「虛擬的」「樣 本平均數分配的常態分配」。 其定義公式為: 平均數 標準差 觀察對象,樣本

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档