第一單元統計學基本概念介紹.pptVIP

下载本文档

6
0
约5.87千字
约 49页
2016-08-10 发布于天津
举报
版权申诉

第一單元統計學基本概念介紹.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一單元統計學基本概念介紹

題型1與2 (應用) 統計分配統計分配還記得王先生只根據一組樣本作為台北市房價平均值的案例? 如果他多抽樣幾組樣本，會不會比較接近真值呢?? 當我們要利用樣本統計量去推論母體參數時，會遭遇到所使用的樣本統計量是否能夠正確的代表母體參數的問題。由於樣本統計量隨樣本的變動而不同，根據樣本統計量所做的推論便含有某一程度的不確定性·為了瞭解此種不確定性的程度，就必須先瞭解樣本統計量的值可能出現的機率(這句話是甚麼意思?) 。樣本統計量的機率分配(這句話是甚麼意思?)，稱為抽樣分配。抽樣分配抽樣分配有了樣本平均數X的抽樣分配，我們可以進一步計算樣本平均數的平均數μx 其中 μx= μ 樣本平均數的標準差加法定理:若母體是常態分配N(μ，σ2)，則X也是常態分配N(μ，σ2/n)，但其間還是存在一差距，只是這差距隨n變化。 Ex:已知成人的身高為一常態分配，平均數為168公分，變異數為100，簡單隨機抽取5人，則5人的平均身高將為常態分配，其平均數為μ=168公分，標準差為中央極限定理觀念複習一般而言，感興趣的是很廣泛的族群(母體，population)，但因母體不易取得，所以會從母體中抽取部份個體(樣本，sample)，再由這些樣本資料來計算一些數字(統計量，Statistics)，估計母體的特性（或參數，parameter)。通常以希臘字表示母體的參數，英文字母表示樣本的統計量。中央極限定理(舉例) 假設一個班級有100人, 我想進行一個抽樣調查~~ 一次抽10人，我可以抽幾次? 10次可以嗎? 可以會有幾個樣本平均數? 10個我能不能把這10個平均數，拿來再算一個平均數? 我能不能把這10個平均數，拿來再算一個標準差? 可以中央極限定理(續) 眾多樣本平均數的平均數 = 母體平均數眾多樣本平均數的標準差 = 標準誤 (standard error) 眾多樣本平均數的分佈 = 常態分佈中央極限定理(續) 中央極限定理（central limit theorem）是推論統計中很基本及重要的定理之一。是指當樣本數n夠大（n30)，則從母體（不一定是常態分佈），非常完美的隨機重複抽出固定n個樣本，樣本平均之抽樣分佈會趨近常態分佈。更廣而言之，母體不一定要連續性分布，就算連續性分布也不限常態，單峰、雙峰、多峰、不規則峰、間斷分布都適用。設母體資料之平均值為μ，標準差為σ。從母體隨機計抽取樣本，每次抽出n個數值，計算其平均值X。重複抽樣無數次，便有無數個X。這些X可組成一分佈，稱為樣本平均數組成的抽樣分佈。中央極限定理(續) 中央極限定理(續) 中央極限定理及抽樣分佈製作身高直方圖母體分布中央極限定理及抽樣分佈(續) A B C 中央極限定理及抽樣分佈(續) 為何要叫做中央極限定理? 母體 n=2~10 n=11~20 n=~100 母體分佈形狀及樣本數對樣本平均之抽樣分佈之影響何時達到中央極限續前頁，從前頁我們可以發現的趨勢，當n越大: 中的 σ x 應越小(即越往中間集中，換句話說就是離散情形越小的類似常態分布) 當n趨近非常大，以台灣人口抽樣而言，如果n趨近於2300萬(極限為全部人口)，那麼μ x分布圖會變甚麼樣? 中央極限定理結論: 若母體為常態(或近似)，則sample size n不論大小，重複抽樣的分布必定為常態。(前頁最右欄) 若母體為未知分布，則sample size n需大於30，則重複抽樣的分布才會為常態，才能用x推估μ。應用題應用題(解) Z Z Z 結語 ■已知數據來自某一母體（μ，σ），只有抽樣一次，可計算出現X之機率。（標準常態分佈） ■未知數據來自哪一母體，假如重複抽樣無限次，便可估計μ 。（中央極限定理） ■未知數據來自哪一母體，只有抽樣一次，可估計件值之範圍。（見後面章節信賴區間） ■未知數據來自哪一母體自一特定母體，評估X檢定），只有抽樣一次，假設數據來來自此母體之可能性。（見後面章節假說檢定）第二單元之一：統計估計-點估計統計估計人們對於未知的事件或現象，通常利用少數已知的資料來估計或推測它的真相，估計是人們最常使用的統計方法之。統計估計是利用樣本統計量來估計母體參數。統計估計可分為點估計及區間估計。一般而言，是先進行點估計，然後再進行區間估計。統計估計(續) 如果是以普查的方法來蒐集資料，則不需要利用估計與檢定的方法來推估母體參數。當我們要研究研究今年大學畢業生的平均薪資或就業比例，或要研究國民的平均所得等問題時，因為母體很大，因此我們必須利用抽樣的方法，去抽取樣本，再從樣本中得出樣本統計