- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一單元統計學基本概念介紹
題型1與2 (應用) 統計分配 統計分配 還記得王先生只根據一組樣本作為台北市房價平均值的案例? 如果他多抽樣幾組樣本,會不會比較接近真值呢?? 當我們要利用樣本統計量去推論母體參數時,會遭遇到所使用的樣本統計量是否能夠正確的代表母體參數的問題。由於樣本統計量隨樣本的變動而不同,根據樣本統計量所做的推論便含有某一程度的不確定性·為了瞭 解此種不確定性的程度,就必須先瞭解樣本統計量的值可能出現的機率(這句話是甚麼意思?) 。 樣本統計量的機率分配(這句話是甚麼意思?),稱為抽樣分配。 抽樣分配 抽樣分配 有了樣本平均數X的抽樣分配,我們可以進一步計算 樣本平均數的平均數μx 其中 μx= μ 樣本平均數的標準差 加法定理:若母體是常態分配N(μ,σ2),則X也是常態分配N(μ,σ2/n),但其間還是存在一差距,只是這差距隨n變化。 Ex:已知成人的身高為一常態分配,平均數為168公分,變異數為100,簡單隨機抽取5人,則5人的平均身高將為常態分配,其平均數為μ=168公分,標準差為 中央極限定理 觀念複習 一般而言,感興趣的是很廣泛的族群(母體,population),但因母體不易取得,所以會從母體中抽取部份個體(樣本,sample),再由這些樣本資料來計算一些數字(統計量,Statistics),估計母體的特性(或參數,parameter)。通常以希臘字表示母體的參數,英文字母表示樣本的統計量。 中央極限定理(舉例) 假設一個班級有100人, 我想進行一個抽樣調查~~ 一次抽10人,我可以抽幾次? 10次可以嗎? 可以 會有幾個樣本平均數? 10個 我能不能把這10個平均數,拿來再算一個平均數? 我能不能把這10個平均數,拿來再算一個標準差? 可以 中央極限定理(續) 眾多樣本平均數的平均數 = 母體平均數 眾多樣本平均數的標準差 = 標準誤 (standard error) 眾多樣本平均數的分佈 = 常態分佈 中央極限定理(續) 中央極限定理(central limit theorem)是推論統計中很基本及重要的定理之一。是指當樣本數n夠大(n30),則從母體(不一定是常態分佈),非常完美的隨機重複抽出固定n個樣本,樣本平均之抽樣分佈會趨近常態分佈。更廣而言之,母體不一定要連續性分布,就算連續性分布也不限常態,單峰、雙峰、多峰、不規則峰、間斷分布都適用。 設母體資料之平均值為μ,標準差為σ。 從母體隨機計抽取樣本,每次抽出n個數值,計算其平均值X。 重複抽樣無數次,便有無數個X。 這些X可組成一分佈,稱為樣本平均數組成的抽樣分佈。 中央極限定理(續) 中央極限定理(續) 中央極限定理及抽樣分佈 製作身高直方圖 母體分布 中央極限定理及抽樣分佈(續) A B C 中央極限定理及抽樣分佈(續) 為何要叫做中央極限定理? 母體 n=2~10 n=11~20 n=~100 母體分佈形狀及樣本數對樣本平均之抽樣分佈之影響 何時達到中央極限 續前頁,從前頁我們可以發現的趨勢,當n越大: 中的 σ x 應越小(即越往中間集中,換句話說就是離散情形越小的類似常態分布) 當n趨近非常大,以台灣人口抽樣而言,如果n趨近於2300萬(極限為全部人口),那麼μ x分布圖會變甚麼樣? 中央極限定理結論: 若母體為常態(或近似),則sample size n不論大小,重複抽樣的分布必定為常態。(前頁最右欄) 若母體為未知分布,則sample size n需大於30,則重複抽樣的分布才會為常態,才能用x推估μ。 應用題 應用題(解) Z Z Z 結語 ■已知數據來自某一母體(μ,σ),只有抽樣一次,可計算出現X之機率。 (標準常態分佈) ■未知數據來自哪一母體,假如重複抽樣無限次,便可估計μ 。 (中央極限定理) ■未知數據來自哪一母體,只有抽樣一次,可估計件值之範圍。 (見後面章節信賴區間) ■未知數據來自哪一母體自一特定母體,評估X檢定),只有抽樣一次,假設數據來來自此母體之可能性。 (見後面章節假說檢定) 第二單元之一:統計估計-點估計 統計估計 人們對於未知的事件或現象,通常利用少數已知的資料來估計或推測它的真相,估計是人們最常使用的統計方法之。統計估計是利用樣本統計量來估計母體參數。統計估計可分為點估計及區間估計。一般而言,是先進行點估計,然後再進行區間估計。 統計估計(續) 如果是以普查的方法來蒐集資料,則不需要利用估計與檢定的方法來推估母體參數。 當我們要研究研究今年大學畢業生的平均薪資或就業比例,或要研究國民的平均所得等問題時,因為母體很大,因此我們必須利用抽樣的方法,去抽取樣本,再從樣本中得出樣本統計
文档评论(0)