统计-正态分布--抽样误差.pptVIP

下载本文档

105
0
约3.09千字
约 32页
2018-04-24 发布于福建
举报
版权申诉

统计-正态分布--抽样误差.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三讲正态分布抽样误差正态分布的概念正态分布的概念频数分布概念频数集中在均数周围，左右基本对称，离均数愈近数据愈多，离均数愈远数据愈少如果观察数不断增多，组距不断细分，直方图的边线将逐渐接近一条光滑曲线这条曲线数学上称为正态曲线—以均数为中心，两侧对称并逐渐下降，永远不与横轴相交的一条钟型曲线正态分布的特性正态分布曲线的特点集中性对称性均匀变动性曲线的位置和形状与两个参数有关正态分布的特性正态分布曲线的参数 μ 为位置参数：σ恒定时，μ增大，曲线沿横轴向右移动；μ减小，曲线沿横轴向左移动 σ 为形状参数：μ恒定时，σ越大，曲线越宽，表示数据越分散；σ越小，曲线越窄，表示数据越集中当资料近似正正态分布时，可以作为μ的估计值，以S作为σ的估计值，估计正态曲线下面积的分布规律标准正态分布标准正态分布：N( 0，1 ) 数据经标准化后，使μ=0，σ=1时的正态分布转换方式任何一个正态分布，都可以通过变换，成为标准正态分布正态分布的应用频数估计估计医学正常参考值范围质量控制统计方法的理论基础频数估计估计医学正常参考值范围研究对象的选择估计范围确定（80%、90%、95%、99%）单双侧的确定方法的选择正态分布偏态分布正态分布的应用质量控制作为上下警戒值作为上下控制值统计方法的理论基础 u 检验、t 分布、F 分布、二项分布、χ2 分布等常用u 值表常用百分位数表二、抽样误差及其应用抽样误差的概念抽样误差的应用参数估计假设检验抽样误差的概念抽样误差由抽样研究引起的样本统计量与总体参数间的差异均数的抽样误差两种表现形式样本统计量与总体参数间的差异样本统计量间的差异抽样误差产生的原因抽样研究个体变异标准误(standard error，SE) 样本统计量的标准差称为标准误，用来衡量抽样误差的大小。标准误与个体变异? 成正比，与样本含量n的平方根成反比。标准误理论值标准误(standard error，SE) 实际工作中，? 往往是未知的，一般可用样本标准差s代替? 标准误的估计值因为标准差s随样本含量的增加而趋于稳定，故增加样本含量可以降低抽样误差 t分布的概念设某一变量Xi服从正态分布N(?,?)，则服从标准正态分布即 t分布的概念从正态分布N(?,?)的总体中随机抽样并计算多个样本均数，它们服从总体均数为?，总体标准差为的正态分布，则也服从标准正态分布。 t分布的概念 t分布的特征 t分布为一簇单峰分布曲线 t分布以0为中心，左右对称 t分布与自由度?有关，自由度越小，t分布的峰越低，而两侧尾部翘得越高；自由度逐渐增大时，t分布逐渐逼近标准正态分布；当自由度为无穷大时，t分布就是标准正态分布参数估计(parameter estimation) 由样本信息估计总体参数点估计(point estimation) 区间估计(interval estimation) 点估计直接用样本统计量作为总体参数的估计值方法简单，但未考虑抽样误差的大小在实际问题中，总体参数往往是未知的，但它们是固定的值，并不是随机变量值。而样本统计量随样本的不同而不同，属随机的区间估计按一定的概率或可信度(1-? )用一个区间估计总体参数所在范围，这个范围称作可信度为1- ?的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。均数的可信区间总体均数的(1-? )可信区间定义为当样本含量较大时，例如n＞100，t分布近似标准正态分布，此时可用标准正态分布代替t分布，作为可信区间的近似计算。相应的100(1-?)％可信区间为可信区间的确切涵义可信度为95% 的可信区间的确切涵义是：每100个样本所算得的100个可信区间，平均有95个包含了总体参数。可信区间的两个要素可靠性反映为可信度1-? 的大小精确性用区间长度CU－CL衡量可信区间与参考值范围的区别可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。 95%的可信区间中的95%是可信度，即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例，即所求参考值范围包含了95%的正常人。标准差与标准误的区别与联系标准差意义