统计学概率和分布PPT.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学概率和分布PPT

N(0,1)分布右侧尾概率P(zza)=a的示意图 §4.4.2 c2-分布 一个由正态变量导出的分布是c2-分布(chi-square distribution,也翻译为卡方分布)。该分布在一些检验中会用到。 n个独立正态变量平方和称为有n个自由度的c2-分布,记为c2(n)。c2-分布为一族分布, 成员由自由度区分。 由于c2-分布变量为正态变量的平方和,它不会取负值。 自由度为2、3、5的c2-分布密度曲线图 §4.4.3 t-分布 正态变量的样本均值也是正态变量,能利用减去其均值再除以其(总体)标准差来得到标准正态变量。 但用样本标准差来代替未知的总体标准差时,得到的结果分布就不再是标准正态分布了。它的密度曲线看上去有些象标准正态分布,但是中间瘦一些,而且尾巴长一些。这种分布称为t-分布(t-distribution,或学生分布,Student’s t)。 §4.4.3 t-分布 不同的样本量通过标准化所产生的t分布也不同, 这样就形成一族分布。 t分布族中的成员是以自由度来区分的。这里的自由度等于样本量减去1(如果样本量为n,刚才定义的t分布的自由度为n-1)。 由于产生t分布的方式很多,简单说自由度就是样本量减1是不准确的。自由度甚至不一定是整数。 标准正态分布和t(1)分布的密度图 §4.4.3 t-分布 通常用ta表示t分布相应于右侧尾概率a的t变量的a上侧分位数,即对于t分布变量T,有P(Tta)=a。在突出自由度时,也用tn,a,也有用t1-a或tn,1-a表示的。 图4.9表示了自由度为2的t(2)分布右边的尾概率(a=0.05)。 t(2)分布右侧尾概率P(tta)=a的示意图 §4.4.4 F-分布 F-分布变量为两个c2-分布变量(在除以它们各自自由度之后)的比; 而两个c2-分布的自由度则为F-分布的自由度,因此,F-分布有两个自由度;第一个自由度等于在分子上的c2-分布的自由度,第二个自由度等于在分母的c2-分布的自由度。 自由度为(3,20)和(50,20)的F-分布密度曲线图 §4.5 累积分布函数 在前面离散分布的情况可以用p(x)表示该变量取值x的概率,如果用大写英文字母X表示相应的随机变量,那么概率P(X=x)= p(x)。而 §4.5 累积分布函数 在连续分布的情况,可以用f(x)表示密度函数,则概率(注意在连续分布中,某单独点的概率为0,因此下式中的不等式中的等式可以去掉) §4.5 累积分布函数 为了计算概率,只知道密度函数对于查表或应用软件来得到已知分布的概率是不方便的,最好能够知道随机变量小于或等于某值的概率。在上面公式中,如果知道了下面的值就可以计算所需的概率了(统计书中的多数分布表的概率是以下面累积分布函数的形式给出的): §4.5 累积分布函数 随机变量小于或等于某个数值的概率就称为累积分布函数(cumulative distribution function,简称cdf)或分布函数。 累积分布函数概念的引进,对于查表或使用软件得到概率(根据上面两个公式)是很方便的。多数概率分布表都是以累积分布函数的形式出现的。 在后面介绍软件时,还要举例说明如何利用累积分布函数。 §4.6 用小概率事件进行判断 判明一个事情的真伪,需要用事实说话。在统计中事实总是来源于数据。 假定某药厂声称该厂生产的某种药品有60%的疗效。但是当实际调查了100名使用该药物的患者之后,发现有40名患者服后有效。 这个数据是否支持药厂的说法呢?药厂所支持的模型实际上是一个参数为0.6的Bernoulli试验模型。100名患者的服药,实际上等于进行了100次试验。这就是二项分布B(100,0.6)模型。 §4.6 用小概率事件进行判断 由于使用了药厂的0.6成功概率。这个模型是基于药厂的观点的。 可以基于这个模型计算100名患者中有少于或等于40名患者治疗有效的概率。 通过计算(或查表,后面会详细描述)易得,在药厂观点正确的假定下,这个概率为0.000042。这说明,如果药厂正确,那么只有40名患者有效这个事实是个小概率事件,即“少于或等于40名患者有效”的可能性只有大约十万分之四。 §4.6 用小概率事件进行判断 这样在药厂的观点和事实之间有了矛盾。是事实准确还是药厂准确呢? 显然人们一般不会认为药厂的说法可以接受。这样,就利用小概率事件来拒绝了药厂的说法。 这种用小概率事件对假定的模型进行判断是后面要介绍的假设检验的基础。 §4.6 大数定律与中心极限定理 一、大数定律:阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。 独立同分布大数定律:提供了用样本平均数估计总体平均数的理论依据 贝努力大数定律 贝努力大数定律:提供了用频率代替概率的理论依据 中心极限定理 二、中心极限定理

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档