抽样分布与参数估计–研.pptVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样分布与参数估计–研

计量资料的统计推断 几个重要概念的回顾: 总体: 样本: 统计量: 参数: 统计分析:统计描述 统计推断:参数估计、假设检验 欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。 由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。 第一节 抽样研究与抽样误差 一、抽样研究 用样本信息推断总体特征的研究方法称为抽样研究。 二、抽样误差 (一)抽样误差:由于个体差异和抽样引起的样本统计量与总体参数之间的差异或各样本统计量之间的差异。 均数的抽样误差:?X ? ? 率的抽样误差: p ? π 正态总体中样本均数抽样分布具有如下特点: ①各样本均数未必等于总体均数; ②各样本均数间存在差异; ③样本均数围绕总体均数呈正态分布; ④样本均数变异范围较原变量变异范围大大缩小。 在非正态分布总体中可进行类似抽样。 1、从正态总体N(?,?2)中,随机抽取例数为n的样本,样本均数?X也服从正态分布;即使从偏态总体抽样,当n足够大时?X也近似正态分布。 2、从均数为?,标准差为?的正态或偏态总体中抽取例数为n的样本,样本均数?X的总体均数也为?,标准差为??X 样本均数的标准差称为均数的标准误(standard error of mean, SEM) 计算: 标准误 意义: 反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。 与样本量的关系:S 一定,n↑,标准误↓ 标准误 用途: 衡量抽样误差大小 估计总体均数可信区间 用于假设检验 (三)率的抽样误差 率的抽样误差:由抽样造成的样本率(p)与总体率(π)的差异。 率的标准误(σp):表明率的抽样误差的大小 第二节 t 分布与总体均数的估计 对正态变量样本均数?X做正态变换(u变换): t分布与标准正态分布的比较 1、二者都是单峰分布,以0为中心左右对称 2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→?时,t分布完全成为标准正态分布 二、总体均数的估计 统计推断:用样本信息推论总体特征。 包括参数估计和假设检验 参数估计:用样本统计量估计总体参数。 1、 点(值)估计:用样本统计量作为对总体参数的估计值 2、 区间估计:根据选定的置信度(或可信度,用概率表示)估计总体参数所在的范围 可信度:估计正确的概率。1- ? 可信区间(confidence level, CI): 总体均数的可信区间 总体均数的95%可信区间 总体均数的95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误) 均数的标准差和标准误的区别 总体均数可信区间与参考值范围的区别 (1)t分布 法 ?未知、n小时按t分布原理 总体均数的100(1-α)%CI: 例3.2:P33 (2)u 分布 法 ?未知但n足够大时按正态分布原理 总体均数100(1-α)%CI : (3)u 分布法 ?已知时按正态分布原理 100(1-α)%CI : 95%的CI: 区间估计的准确度:说对的可能性大小, 用 (1-?) 来衡量。99%的可信区间好于95%的可信区间(n, S 一定时)。 区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S 一定时)。 准确度与精确度的关系: … … 计算 用于表示抽样误差大小、总体均数的区间估计和均数的假设检验等 描述资料的频数分布状况,可用于制定医学参考值范围 用途 描述样本均数的变异程度,说明抽样误差的大小。其值越小,估计总体均数的可靠性越大… 描述观察值的变异程度。其值越小,观察值的变异程度越小,均数的代表性越好… 意义 标准误 标准差 正态分布法或 百分位数法 U分布法或t分布法 计算 方法 绝大多数观察对象某项指标的分布范围 总体均数的区间估计 用途 “正常人”的解剖、生理、生化某项指标的波动范围 个体值的波动范围 按预先给定的概率确定的未知参数μ的可能范围 总体均数的可能范围 含义 参考值范围 总体均数的可信区间 * * 样本 总体 统计推断:用样本信息推论总体特征的过程。 包括: 参数

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档