常态分配与T分配作者howard常态分配与t-分配是很类似的机率分配.PDFVIP

下载本文档

5
0
约3.2千字
约 7页
2016-01-14 发布于天津
举报
版权申诉

常态分配与T分配作者howard常态分配与t-分配是很类似的机率分配.PDF

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

常态分配与T分配作者howard常态分配与t-分配是很类似的机率分配

6sigma 品质网常态分配与T分配作者: howard 常态分配与t-分配是很类似的机率分配模式，一个是有比较集中的峰态与单薄的尾部，一个是有比较偏平的峰态与厚重的的尾部，但两者都是属于对称型的分配模式。我们知道做母体平均数的估计(点估计/ 区间估计)或是假设检定时，都知道可以用常态(正态)分配或是t-分配来做。就学理上来说，其中的差别在那里：什么时候该用常态分配、什么时候该用t-分配？大数法则有告诉我们，只要样本数够大，样本平均数( X ) 的分配会收敛到一个常态分配。所以说，不管原来的母体真正的分配是那一种，应该通通都可以用常能分配就可以啦！那为什么还要多考虑一个t- 分配呢？问题就出在于我们对原来母体离散程度的了解。大家想想看，我们会用那个值来描述资料的离中趋势？没有错，就是Standard Deviation (标准差) 。一般来说，最常用来代表资料的集中性质的量就是Variance(变异数或方差) 。但是变异数与原来资料的单位不一样─因为变异数的单位是原来单位的平方，所以就把变异数取二分之一次，得到的量就跟原来的单位是一致的，这个值就是标准差。我们一般在做问题讨论时，都是用标准差而不是用变异数。所以答案的关键就在于母体标准差是否为已知。如果说母体的标准差已知，或是由过去的经验得到一个可以用来代表母体标准差的量，则就用常态分配(Z)的方法。反之，当母体标准差未知时，就必须用t-分配的方法。为什么呢？在接下来的说明之前，我们先来看看T-分配的由来。可能会用到一些数理统计的术语，或是比较数学化的一些定义，大家看看就好。令X 与Y 表两个独立的随机变量(Random Variable) ，其分配模式分别为X 为标准常态分配，Y 是具自由度＝df 的卡方(Chi-Square)分配。以符号表示如下： 6sigma 品质网另外，令则随机变量T 为具有具自由度＝df 的Student’s t-分配，简称为t-分配。 t-分配是英国学者Gosset 于1908 年以笔名Student 所发表的，故取名为t 分配。t 分配跟常态分配一样，都是对称于平均数的机率分配，且其平均数与标准常态分配一样＝0 。与常态分配最大的不同点在于， t 分配的形状会随着自由度(Degree of Freedom) 的不同而改变。如下图所示：所谓自由度是指统计量中各变量可以自由变动的个数，当统计量中每增加一个条件时，自由度就会少一个。当自由度越小，t 分配的离散程度就越大；相对地，当自由度越大时，t 分配的离散程度就越小，而且会越接近标准常态分配。一般来说，当df ≧ 30 时，t 分配与标准常态分配已经非常类似了；尤其当df →∞ (表示很大很大) ，t 分配也可视为一个标准常态分配。接下来，我们要解释一个很重要的性质。就是因为有这个性质的存在，我们才能得到所要的结果。 6sigma 品质网我们可以知道：样本平均数是母体平均数的不偏估计量，而样本变异数为母体变异数的不偏估计量。亦即在此符号E 表期望值的计算，而不偏估计量的意义就是统计量取期望值之后，计算的结果就等于该参数值。这个在数理统计上已经为我们解决这个问题、已经证明它的合法性，所以我们不需要去担心为什么。数理统计与应用统计的区别在于，数理统计要去找一些好的性质、好的统计方法，并且以数学基础来证明它的合法性；而应用统计或在实务的应用上，我们不用去烦恼这些问题，我们只要会使用这些方法就可以了。到此，我们该具备的基本知识都差不多了。以下就开始来解释什么时 6sigma 品质网候用Z 分配、什么时候用t 分配。很明显地，如果我们对于母体的分散性质有所了解－母体变异数已知或有一个先验值可以来代替，所有的讨论都可以直接用Z 分配来解释。但是如果母体变异数未知，而且也没有适当的先验值可以来说明，则在Z 分配中分母的位置是一个未知量，所以必须找一个适当的统计量来估计。由前面的解释过程，我们知道用母体变异数的不偏估计量 S^2 是最直接的。所以所以原本Z 统计量中分母σ为未知的量，可以直接用S(样本的标准差)来取代，而且所成的统计量刚好就是自由度为n-1 的t-分配。因此，