- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学-5抽样与抽样分布 上章复习-内容概要 统计软件中与概率有关的函数 1 计算分布的概率(离散)或概率密度(连续)的函数。 SPSS: PDF EXCEL: =DIST (最后一位参数设为0) 2 计算分布的累计概率的函数 SPSS: CDF EXCEL: =DIST(最后一位参数设为1) 3 计算分布的累计概率函数的反函数 SPSS: IDF EXCEL: =INV 上章复习-内容概要 SPSS 二项分布:CDF.BINOM 超几何分布:CDF.HYPER 泊松分布:CDF.POISSON 均匀分布:(x-a)/(b-a) (a≤x≤b,a和b为起点和终点) 正态分布:CDF.NORMAL 标准正态分布:同上 卡方分布:CDF.CHISQ t分布:CDF.T F分布:CDF.F 上章复习-内容概要 EXCEL 二项分布:=Binomdist 超几何分布:= HYPGEOMDIST (无cumulative) 泊松分布:=POISSON 均匀分布:(x-a)/(b-a) (a≤x≤b,a和b为起点和终点) 正态分布:NORMDIST 标准正态分布:NORMSDIST(Z)(只返回累积概率) 卡方分布:CHIDIST t分布:TDIST F分布:FDIST 上章复习-作业 课后练习 抽样-为什么抽样 1、试验是破坏性的。 2、全面调查很难办到或没有必要,或费用过高、或耗时过长 3、样本结论已经足以反映总体性质了,全面调查增加的准确性很微小。 抽样-概念 总体、个体、样本、样本(容)量、样本个数 有限总体 无限总体 统计量、参数 总体参数:μ、σ、π。 样本统计量:样本均值、s、p。 例:如μ已知,而σ未知, ∑(xi-μ)2 ∑Xi/σ 抽样方法 概率样本 非概率样本 概率样本 简单随机抽样 RND(RV.UNIFORM(a,b) =ROUND(RAND()*(b-a)+a,0) 系统抽样 分层抽样 整群抽样 多级抽样 抽样分布 抽样分布 由于现实中不可能将所有的样本都抽取一遍,因此,统计量的抽样分布实际上是一种理论分布。 【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下 总体分布 1 4 2 3 0 .1 .2 .3 样本均值的抽样分布 现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表 3,4 3,3 3,2 3,1 3 2,4 2,3 2,2 2,1 2 4,4 4,3 4,2 4,1 4 1,4 4 1,3 3 2 1 1,2 1,1 1 第二个观察值 第一个 观察值 所有可能的n = 2 的样本(共16个) 样本均值的抽样分布 计算出各样本的均值,如下表。并给出样本均值的抽样分布 3.5 3.0 2.5 2.0 3 3.0 2.5 2.0 1.5 2 4.0 3.5 3.0 2.5 4 2.5 4 2.0 3 2 1 1.5 1.0 1 第二个观察值 第一个 观察值 16个样本的均值(x) 样本均值的抽样分布 1.0 0 .1 .2 .3 P ( x ) 1.5 3.0 4.0 3.5 2.0 2.5 x 所有样本均值的均值和方差 式中:M为样本均值的个数 样本均值的抽样分布 样本均值的抽样分布 中心极限定理:若给定样本量的所有样本来自任意总体,则样本均值的抽样分布近似服从正态分布,且样本量越大,近似性越强。 1)总体为正态分布,无论n的大小,样本均值的抽样分布都服从正态分布 N(μ,σ/√n); 2)总体形态未知或不为正态分布时,通常样本量n≥30时,样本均值的抽样分布将趋于正态分布N(μ,σ/√n),样本量越大,近似性越强。 3)样本均值的均值=μ,样本均值的标准差=σ/√n。 4)样本均值的分布范围小于总体分布范围,样本均值的标准差=σ/√n,因此,样本量越大,样本均值分布范围越小,集中程度越大。 样本均值的抽样分布 样本均值的抽样分布的应用 样本均值的标准化 Z=(X-μ) /σ(X代表任一观测值) Z(均值)=(均值-μ) / ( σ/√n) 当n≥30,可以用样本标准差估计总体标准差。 z (均值)=(均值-μ) / ( s/√n) 应用:P123 例5.2;例5.3; 例5.4 样本比例的抽样分布 样本比例p; 总体比例π。 p=X/n p的抽样分布是样本比例p的所有可能取值的概率分布。当np≥5和n(1-p)≥5
原创力文档


文档评论(0)