- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
极限定理和抽样分布切贝谢夫定理:Chebyshev’sTheorem如果k=2,则至少有75%的个案分布在2倍的标准差之内;如果k=3,则至少有89%但个案分布在3倍的标准差之内。第2页,共27页,星期六,2024年,5月切贝谢夫不等式我们知道一个分布的特征值(如均值和方差)去推算这个分布的情况第3页,共27页,星期六,2024年,5月当不知道总体分布而只知道总体特征值的时候,对概率分布做最保守的估计。注意:(1)这是保守的估计,因为不知道总体的分布;(2)由于这里指的是绝对离差,所以我们难以推知一端数据的概率,除非我们知道这个分布是对称分布。第4页,共27页,星期六,2024年,5月极限定理:研究观察次数趋向无限次时,随机事件的变化方式。分类:1大数定理:在什么条件下,随机事件可以转化为不可能事件或必然事件。(特征值)(LawofLargeNumbers)2中心极限定理:在什么条件下,随机变量之和的分布可以近似为正态分布。(CentralLimitTheory)第5页,共27页,星期六,2024年,5月一、贝努里大数定理(N变大时,诸随机变量的均值逐步接近总体的均值)样本成数,实际上是指的样本频率。在讲离散型随机变量的概率分布时,我们将随机变量X定义为“A类事件出现的次数”。我们将出现的实际次数(m)除以总试验次数(n),得到的A类实际出现的频率,我们叫做样本成数:,这是一个已知的、固定的值。样本均值,是指将每一次独立试验的X的实际取值取平均数,得到的是样本均值:第6页,共27页,星期六,2024年,5月在趋于极限时,离散变量的特征值行为:频率值趋近于概率值,或者说样本成数无限趋近于总体成数。(可以看作n次独立实验,就有n个独立同分布的随机变量,每一个都是二点分布,数学期望p方差pq)第7页,共27页,星期六,2024年,5月二、切贝谢夫大数定理(N变大时,诸随机变量的均值逐步接近总体的均值)在趋于极限时,连续变量的特征值行为:平均值趋近于数学期望,或者说样本均值无限趋近于总体均值。第8页,共27页,星期六,2024年,5月三、中心极限定理第9页,共27页,星期六,2024年,5月几种等效的公式:第10页,共27页,星期六,2024年,5月抽样分布1总体分布populationdistributionX的所有取值形成的分布。我们在分析中往往不能知道总体分布的情况。2样本分布Sampledistribution3抽样分布第11页,共27页,星期六,2024年,5月理解抽样分布(1)设想我们从一个总体中抽取一个样本容量为n的样本;(2)抽取之后我们得到了样本;(3)我们现在把这个样本均值也看作是一个随机变量(它的确是个随机变量);(4)样本均值的概率分布就是当我们重复不断抽取n个样本时,我们得到的不同的样本均值出现的可能性是不同的,也就是说它会有一个概率分布。我们把这个分布叫做样本均值的抽样分布;(5)当样本容量增大时,无论总体是什么分布,根据中心极限定理,样本均值的抽样分布是一个正态分布。样本均值的数学期望就是总体的均值,而它的方差是总体方差的1/n。第12页,共27页,星期六,2024年,5月第13页,共27页,星期六,2024年,5月样本均值的抽样分布(连续型变量)样本均值是什么形式,与两个因素有关系:(1)总体分布(2)样本容量当n=50时,不论总体分布如何,样本均值均服从正态分布。(这里也可以写出均值的均值)(注意这里用S表示样本的标准差)样本方差在样本容量逐渐增大时和总体方差一样了。是以总体为期望值的。第14页,共27页,星期六,2024年,5月则当n很大时,t分布的方差为1,接近标准正态分布。为了查表方便,n30时,当成正态分布第15页,共27页,星期六,2024年,5月当总体为有限总体时且不放回抽样时,n=50样本的均值服从正态分布这里需要方差已知校正系数当总体为有限正态总体时且不放回抽样时,n50样本的均值服从正态分布,必须是方差已知第16页,共27页,星期六,2024年,5月总结样本均值的抽样分布:抽样误差/标准误第17页,共27页,星期六,2024年,5月样本方差的抽样分布统计证明,当总体分布为正态分布时,则比值:当n变大时,卡方分布变成正态分布。第18页,共27页,星期六,2024年,5月当n逐渐增大时,我们将随机变量X看作是n个独立同分布的二点分布中事件A出现的次数,这样X实际上是n个二点随机变量之和。根据中心极限定理,X~N(np,npq)样本成数的抽样分布第19页,共27页,星
文档评论(0)