- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
常态分配与T分配作者howard常态分配与t-分配是很类似的机率分配
6sigma 品质网
常态分配与T分配
作者: howard
常态分配与t-分配是很类似的机率分配模式,一个是有比较集中的峰
态与单薄的尾部,一个是有比较偏平的峰态与厚重的的尾部,但两者
都是属于对称型的分配模式。
我们知道做母体平均数的估计(点估计/ 区间估计)或是假设检定时,都
知道可以用常态(正态)分配或是t-分配来做。
就学理上来说,其中的差别在那里:什么时候该用常态分配、什么时
候该用t-分配?
大数法则有告诉我们,只要样本数够大,样本平均数( X ) 的分配会收
敛到一个常态分配。所以说,不管原来的母体真正的分配是那一种,
应该通通都可以用常能分配就可以啦!那为什么还要多考虑一个t-
分配呢?问题就出在于我们对原来母体离散程度的了解。大家想想
看,我们会用那个值来描述资料的离中趋势?
没有错,就是Standard Deviation (标准差) 。一般来说,最常用来代
表资料的集中性质的量就是Variance(变异数或方差) 。但是变异数与
原来资料的单位不一样─因为变异数的单位是原来单位的平方,所以
就把变异数取二分之一次,得到的量就跟原来的单位是一致的,这个
值就是标准差。我们一般在做问题讨论时,都是用标准差而不是用变
异数。
所以答案的关键就在于母体标准差是否为已知。
如果说母体的标准差已知,或是由过去的经验得到一个可以用来代表
母体标准差的量,则就用常态分配(Z)的方法。反之,当母体标准差
未知时,就必须用t-分配的方法。为什么呢?
在接下来的说明之前,我们先来看看T-分配的由来。可能会用到一些
数理统计的术语,或是比较数学化的一些定义,大家看看就好。
令X 与Y 表两个独立的随机变量(Random Variable) ,其分配模式分别
为X 为标准常态分配,Y 是具自由度=df 的卡方(Chi-Square)分配。
以符号表示如下:
6sigma 品质网
另外,令
则随机变量T 为具有具自由度=df 的Student’s t-分配,简称为t-分配。
t-分配是英国学者Gosset 于1908 年以笔名Student 所发表的,故取名
为t 分配。t 分配跟常态分配一样,都是对称于平均数的机率分配,
且其平均数与标准常态分配一样=0 。与常态分配最大的不同点在于,
t 分配的形状会随着自由度(Degree of Freedom) 的不同而改变。如下
图所示:
所谓自由度是指统计量中各变量可以自由变动的个数,当统计量中每
增加一个条件时,自由度就会少一个。当自由度越小,t 分配的离散
程度就越大;相对地,当自由度越大时,t 分配的离散程度就越小,
而且会越接近标准常态分配。一般来说,当df ≧ 30 时,t 分配与标
准常态分配已经非常类似了;尤其当df →∞ (表示很大很大) ,t 分配
也可视为一个标准常态分配。
接下来,我们要解释一个很重要的性质。就是因为有这个性质的存在,
我们才能得到所要的结果。
6sigma 品质网
我们可以知道:样本平均数是母体平均数的不偏估计量,而样本变异
数为母体变异数的不偏估计量。亦即
在此符号E 表期望值的计算,而不偏估计量的意义就是统计量取期望
值之后,计算的结果就等于该参数值。
这个在数理统计上已经为我们解决这个问题、已经证明它的合法性,
所以我们不需要去担心为什么。数理统计与应用统计的区别在于,数
理统计要去找一些好的性质、好的统计方法,并且以数学基础来证明
它的合法性;而应用统计或在实务的应用上,我们不用去烦恼这些问
题,我们只要会使用这些方法就可以了。
到此,我们该具备的基本知识都差不多了。以下就开始来解释什么时
6sigma 品质网
候用Z 分配、什么时候用t 分配。
很明显地,如果我们对于母体的分散性质有所了解-母体变异数已知
或有一个先验值可以来代替,所有的讨论都可以直接用Z 分配来解
释。
但是如果母体变异数未知,而且也没有适当的先验值可以来说明,则
在Z 分配中分母的位置是一个未知量,所以必须找一个适当的统计量
来估计。由前面的解释过程,我们知道用母体变异数的不偏估计量
S^2 是最直接的。所以
所以原本Z 统计量中分母σ为未知的量,可以直接用S(样本的标准
差)来取代,而且所成的统计量刚好就是自由度为n-1 的t-分配。因此,
文档评论(0)