统计学三大分布与正态分布的关系讲课稿.docVIP

统计学三大分布与正态分布的关系讲课稿.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学三大分布与正态分布的关系[1] 张柏林 理实1002班 摘要:本文首先将介绍分布,分布,分布和正态分布的定义及基本性质,然后用理论说明分布,分布,分布与正态分布的关系,并且利用数学软件MATLAB来验证之. 1. 三大分布函数[2] 1.1分布 分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量相互独立,且都来自正态总体,则称统计量为服从自由度为的分布,记为. 分布的概率密度函数为 其中伽玛函数,分布的密度函数图形是一个只取非负值的偏态分布,如下图. 卡方分布具有如下基本性质: 性质1:; 性质2:若,相互独立,则; 性质3:; 性质4:设,对给定的实数称满足条件: 的点为分布的水平的上侧分位数. 简称为上侧分位数. 对不同的与n, 分位数的值已经编制成表供查用. 分布的上分位数 1.2分布 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设,相互独立,,则称统计量服从自由度为的分布,记为. 分布的密度函数为 分布的密度函数图 分布具有如下一些性质: 性质1:是偶函数,; 性质2:设,对给定的实数 称满足条件;的点为分布的水平的上侧分位数. 由密度函数的对称性,可得 类似地,我们可以给出t分布的双侧分位数 显然有 对不同的与, 分布的双侧分位数可从附表查得. 分布的上分位数 1.3分布 分布是随机变量的另一种重要的小样本分布,应用也相当广泛. 它可用来检验两个总体的方差是否相等,多个总体的均值是否相等. 分布还是方差分析和正交设计的理论基础. 定义:设,相互独立,令则称统计量服从为第一自由度为,第二自由度为的分布. 分布的密度函数图 分布具有如下一些性质: 性质1:若; 性质2:若,则; 性质3:设,对给定的实数称满足条件; 的点为分布的水平的上侧分位数. 分布的上分位数 分布的上侧分位数的可自附表查得. 性质4: 此式常常用来求分布表中没有列出的某些上侧分位数. 1.4正态分布 正态分布是数理统计中的一种重要的理论分布 ,是许多统计方法的理论基础. 高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布. 正态分布有两个参数,μ和σ,决定了正态分布的位置和形态. 为了应用方便,常将一般的正态变量X通过u变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布. 正态分布的密度函数和分布函数 若连续型随机变量具有概率密度为 其中为常数,则称服从参数为的正态分布,记为. 正态分布的密度函数图 特征1:正态曲线(normal curve)在横轴上方均数处最高; 特征2:正态分布以均数为中心,左右对称; 特征3:正态分布有两个参数,即均数和标准差. 是位置参数,固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动. 是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭. 通常用表示均数为,方差为的正态分布. 用表示标准正态分布. 特征4:正态曲线下面积的分布有一定规律。 实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率. 正态曲线下一定区间的面积可以通过标准正态分布函数表求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计. 2. 三大分布与正态分布的密度函数比较[3] 2.1分布收敛于正态分布 设,则对任意x,有. 证明:因为 分布的 所以由独立同分布中心极限定理得 因为且 所以 因为 所以 = 令,利用Stirling公式: 则上式= = = = 所以分布的极限分布为正态分布. 下面用MATLAB来验证上面结论,首先定义分布函数和相应的正态分布,再依次增大,比较两者关系:[4] 从上面三个图形可以看出,越大,分布密度函数与正态分布度函数越接近,这就和所证结论相符合. 2.2t分布收敛于标准正态分布 若服从自由度为的t分布, (1) 证法1:由于自由度为n的t分布的概率密度函数为 因此(1)式等价于 (2) 先利用Stirling公式: 证明 事实上,利用函数的性质 当时 当时亦可推出同样的结果。 另外,由特殊极限公式可得 综合上诉,即证明(2)式 所以,分布的极限分布是正态分布. 下面用MATLAB来验证上面结论,首先定义

文档评论(0)

150****8484 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档