统计-正态分布--抽样误差.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三讲 正态分布 抽样误差 正态分布的概念 正态分布的概念 频数分布概念 频数集中在均数周围,左右基本对称,离均数愈近数据愈多,离均数愈远数据愈少 如果观察数不断增多,组距不断细分,直方图的边线将逐渐接近一条光滑曲线 这条曲线数学上称为正态曲线—以均数为中心,两侧对称并逐渐下降,永远不与横轴相交的一条钟型曲线 正态分布的特性 正态分布曲线的特点 集中性 对称性 均匀变动性 曲线的位置和形状与两个参数有关 正态分布的特性 正态分布曲线的参数 μ 为位置参数:σ恒定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动 σ 为形状参数:μ恒定时,σ越大,曲线越宽,表示数据越分散;σ越小,曲线越窄,表示数据越集中 当资料近似正正态分布时,可以 作为μ的估计值,以S作为σ的估计值,估计正态曲线下面积的分布规律 标准正态分布 标准正态分布:N( 0,1 ) 数据经标准化后,使μ=0,σ=1时的正态分布 转换方式 任何一个正态分布,都可以通过变换,成为标准正态分布 正态分布的应用 频数估计 估计医学正常参考值范围 质量控制 统计方法的理论基础 频数估计 估计医学正常参考值范围 研究对象的选择 估计范围确定(80%、90%、95%、99%) 单双侧的确定 方法的选择 正态分布 偏态分布 正态分布的应用 质量控制 作为上下警戒值 作为上下控制值 统计方法的理论基础 u 检验、t 分布、F 分布、二项分布、χ2 分布等 常用u 值表 常用百分位数表 二、抽样误差及其应用 抽样误差的概念 抽样误差的应用 参数估计 假设检验 抽样误差的概念 抽样误差 由抽样研究引起的样本统计量与总体参数间的差异 均数的抽样误差 两种表现形式 样本统计量与总体参数间的差异 样本统计量间的差异 抽样误差产生的原因 抽样研究 个体变异 标准误(standard error,SE) 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 标准误与个体变异? 成正比,与样本含量n的平方根成反比。 标准误理论值 标准误(standard error,SE) 实际工作中,? 往往是未知的,一般可用样本标准差s代替? 标准误的估计值 因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差 t分布的概念 设某一变量Xi服从正态分布N(?,?),则 服从标准正态分布 即 t分布的概念 从正态分布N(?,?)的总体中随机抽样并计算多个样本均数 ,它们服从总体均数为?,总体标准差为 的正态分布,则 也服从标准正态分布。 t分布的概念 t分布的特征 t分布为一簇单峰分布曲线 t分布以0为中心,左右对称 t分布与自由度?有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布 参数估计(parameter estimation) 由样本信息估计总体参数 点估计(point estimation) 区间估计(interval estimation) 点估计 直接用样本统计量作为总体参数的估计值 方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的 区间估计 按一定的概率或可信度(1-? )用一个区间估计总体参数所在范围,这个范围称作可信度为1- ?的可信区间(confidence interval, CI),又称置信区间 。这种估计方法称为区间估计。 均数的可信区间 总体均数的(1-? )可信区间定义为 当样本含量较大时,例如n>100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间的近似计算。相应的100(1-?)%可信区间为 可信区间的确切涵义 可信度为95% 的可信区间的确切涵义是:每100个样本所算得的100个可信区间,平均有95个包含了总体参数 。 可信区间的两个要素 可靠性 反映为可信度1-? 的大小 精确性 用区间长度CU-CL衡量 可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。 标准差与标准误的区别与联系 标准差 意义

文档评论(0)

moon8888 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档