- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第七章
极限定理和抽样分布
如果k=2,则至少有75%的个案分布在2倍的标准差之内;如果k=3,则至少有89%但个案分布在3倍的标准差之内。02切贝谢夫定理:Chebyshev’sTheorem01
切贝谢夫不等式我们知道一个分布的特征值(如均值和方差)去推算这个分布的情况
当不知道总体分布而只知道总体特征值的时候,对概率分布做最保守的估计。注意:这是保守的估计,因为不知道总体的分布;由于这里指的是绝对离差,所以我们难以推知一端数据的概率,除非我们知道这个分布是对称分布。
极限定理:研究观察次数趋向无限次时,随机事件的变化方式。分类:大数定理:在什么条件下,随机事件可以转化为不可能事件或必然事件。(特征值)(LawofLargeNumbers)中心极限定理:在什么条件下,随机变量之和的分布可以近似为正态分布。(CentralLimitTheory)
贝努里大数定理(N变大时,诸随机变量的均值逐步接近总体的均值)01样本成数,实际上是指的样本频率。在讲离散型随机变量的概率分布时,我们将随机变量X定义为“A类事件出现的次数”。我们将出现的实际次数(m)除以总试验次数(n),得到的A类实际出现的频率,我们叫做样本成数:,这是一个已知的、固定的值。02样本均值,是指将每一次独立试验的X的实际取值取平均数,得到的是样本均值:03
在趋于极限时,离散变量的特征值行为:频率值趋近于概率值,或者说样本成数无限趋近于总体成数。0102(可以看作n次独立实验,就有n个独立同分布的随机变量,每一个都是二点分布,数学期望p方差pq)
在趋于极限时,连续变量的特征值行为:平均值趋近于数学期望,或者说样本均值无限趋近于总体均值。二、切贝谢夫大数定理(N变大时,诸随机变量的均值逐步接近总体的均值)
三、中心极限定理
几种等效的公式:
总体分布populationdistributionX的所有取值形成的分布。我们在分析中往往不能知道总体分布的情况。样本分布Sampledistribution抽样分布抽样分布想我们从一个总体中抽取一个样本容量为n的样本;我们现在把这个样本均值也看作是一个随机变量(它的确是个随机变量);抽取之后我们得到了样本;样本均值的概率分布就是当我们重复不断抽取n个样本时,我们得到的不同的样本均值出现的可能性是不同的,也就是说它会有一个概率分布。我们把这个分布叫做样本均值的抽样分布;05当样本容量增大时,无论总体是什么分布,根据中心极限定理,样本均值的抽样分布是一个正态分布。样本均值的数学期望就是总体的均值,而它的方差是总体方差的1/n。理解抽样分布
(注意这里用S表示样本的标准差)1样本均值是什么形式,与两个因素有关系:2总体分布3样本容量当n=50时,不论总体分布如何,样本均值均服从正态分布。4(这里也可以写出均值的均值)样本方差在样本容量逐渐增大时和总体方差一样了。是以总体为期望值的。5样本均值的抽样分布(连续型变量)
则当n很大时,t分布的方差为1,接近标准正态分布。01.为了查表方便,n30时,当成正态分布02.
当总体为有限总体时且不放回抽样时,n=50样本的均值服从正态分布这里需要方差已知校正系数当总体为有限正态总体时且不放回抽样时,n50样本的均值服从正态分布,必须是方差已知
抽样误差/标准误总结样本均值的抽样分布:
01统计证明,当总体分布为正态分布时,则比值:02当n变大时,卡方分布变成正态分布。样本方差的抽样分布
根据中心极限定理,X~N(np,npq)02当n逐渐增大时,我们将随机变量X看作是n个独立同分布的二点分布中事件A出现的次数,这样X实际上是n个二点随机变量之和。01样本成数的抽样分布
因为p还涉及到总体分布的方差。总体分布方差越大,就要求n越大才会形成正态分布在这里,我们讨论在何种情况下,二项分布会趋近于正态分布呢?取决于两个条件:1、二项分布的偏度p(总体分布)2、样本容量n二项分布的极限行为:P的取值为什么很重要?
若p取值偏小,则虽然n比较大,以正态分布模拟二项分布误差太大:
按二项分布计算
按样本成数计算
若x~B(10,0.5)
若n变大,n=30,例如n=100,p=0.1
对二项分布的总结:
您可能关注的文档
最近下载
- 2022年上海市春季高考语文真题试卷含详解与写作参考范文.docx VIP
- 2023年上海市春季高考语文试卷真题含答案及评分标准.pdf VIP
- 运动会铅球宣传稿.docx VIP
- 《离心机 安全要求gb 19815-2021》详细解读.pdf
- 2025年1月上海市春季高考语文真题(附答案解析).docx VIP
- 2025湖北银行笔试题库及答案.doc VIP
- 2025年上海市高考语文真题试卷及答案.docx VIP
- 《国有企业管理人员处分条例》课件.pptx VIP
- 58同城如何发布房屋出租信息?房屋出租技巧?.doc VIP
- 人教版高中英语必修第一册《UNIT 3 SPORTS AND FITNESS》大单元整体教学设计.docx
文档评论(0)