第7章极限定理和抽样分布.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章极限定理和抽样分布

若p取值偏小,则虽然n比较大,以正态分布模拟二项分布误差太大: 按二项分布计算 按样本成数计算 若x ~ B (10, 0.5) 若n变大,n=30, 例如 n=100, p=0.1 对二项分布的总结: 第七章 极限定理和抽样分布 切贝谢夫定理:Chebyshev’s Theorem 如果k=2,则至少有75%的个案分布在2倍的标准差之内; 如果k=3,则至少有89%但个案分布在3倍的标准差之内。 切贝谢夫不等式 我们知道一个分布的特征值(如均值和方差)去推算这个分布的情况 当不知道总体分布而只知道总体特征值的时候,对概率分布做最保守的估计。 注意: (1)这是保守的估计,因为不知道总体的分布; (2)由于这里指的是绝对离差,所以我们难以推知一端数据的概率,除非我们知道这个分布是对称分布。 极限定理:研究观察次数趋向无限次时,随机事件的变化方式。 分类: 1 大数定理:在什么条件下,随机事件可以转化为不可能事件或必然事件。(特征值)(Law of Large Numbers) 2 中心极限定理:在什么条件下,随机变量之和的分布可以近似为正态分布。(Central Limit Theory) 一、贝努里大数定理(N变大时,诸随机变量的均值逐步接近总体的均值) 样本成数,实际上是指的样本频率。在讲离散型随机变量的概率分布时,我们将随机变量X定义为“A类事件出现的次数”。我们将出现的实际次数(m)除以总试验次数(n),得到的A类实际出现的频率,我们叫做样本成数: ,这是一个已知的、固定的值。 样本均值,是指将每一次独立试验的X的实际取值取平均数,得到的是样本均值: 在趋于极限时,离散变量的特征值行为:频率值趋近于概率值,或者说样本成数无限趋近于总体成数。 (可以看作n次独立实验,就有n个独立同分布的随机变量,每一个都是二点分布,数学期望p方差pq) 二、切贝谢夫大数定理(N变大时,诸随机变量的均值逐步接近总体的均值) 在趋于极限时,连续变量的特征值行为:平均值趋近于数学期望,或者说样本均值无限趋近于总体均值。 三、中心极限定理 几种等效的公式: 抽样分布 1 总体分布 population distribution X的所有取值形成的分布。我们在分析中往往不能知道总体分布的情况。 2 样本分布 Sample distribution 3 抽样分布 理解抽样分布 (1)设想我们从一个总体中抽取一个样本容量为n的样本; (2)抽取之后我们得到了样本; (3)我们现在把这个样本均值也看作是一个随机变量(它的确是个随机变量); (4)样本均值的概率分布就是当我们重复不断抽取n个样本时,我们得到的不同的样本均值出现的可能性是不同的,也就是说它会有一个概率分布。我们把这个分布叫做样本均值的抽样分布; (5)当样本容量增大时,无论总体是什么分布,根据中心极限定理,样本均值的抽样分布是一个正态分布。 样本均值的数学期望就是总体的均值,而它的方差是总体方差的1/n。 样本均值的抽样分布(连续型变量) 样本均值是什么形式,与两个因素有关系: (1)总体分布 (2)样本容量 当n=50时,不论总体分布如何,样本均值均服从正态分布。 (这里也可以写出均值的均值) (注意这里用S表示样本的标准差) 样本方差在样本容量逐渐增大时和总体方差一样了。是以总体为期望值的。 则当n很大时,t分布的方差为1,接近标准正态分布。 为了查表方便,n30时,当成正态分布 当总体为有限总体时且不放回抽样时,n=50 样本的均值服从正态分布 这里需要 方差已知 校正系数 当总体为有限正态总体时且不放回抽样时,n50 样本的均值服从正态分布,必须是方差已知 总结样本均值的抽样分布: 抽样误差/标准误 样本方差的抽样分布 统计证明,当总体分布为正态分布时,则比值: 当n变大时,卡方分布变成正态分布。 当n逐渐增大时,我们将随机变量X看作是n个独立同分布的二点分布中事件A出现的次数,这样X实际上是n个二点随机变量之和。 根据中心极限定理,X~N(np,npq) 样本成数的抽样分布 二项分布的极限行为: 在这里,我们讨论在何种情况下,二项分布会趋近于正态分布呢? 取决于两个条件: 1、二项分布的偏度 p (总体分布) 2、样本容量 n P的取值为什么很重要? 因为p还涉及到总体分布的方差。总体分布方差越大,就要求n越大才会形成正态分布

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档