- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计:均数的抽样误差与总体均数估计
第三章 抽样分布与参数估计 基本概念(复习) 总体:根据研究目的所定的同质研究对象中所有观察单位的某变量值的集合。分无限总体和有限总体。 样本:按随机化原则从同质总体中随机抽取的部分观察单位的某变量值的集合。 变量类型:数值变量资料和分类变量资料。 统计量:描述样本特征的指标 。 参数:描述总体特征的指标 。 基本概念(复习) 概率:描述随机事件发生可能性大小的一个度量。 正态分布 ;标准正态分布 抽样研究(sampling study):用样本信息推断总体特征的研究方法。 统计推断(statistical inference):即如何抽样以及如何用样本信息推断总体特征。包括总体参数估计和假设检验。 抽样研究:样本信息 总体特征 统计推断: 总体参数的估计 假设检验 抽样误差(sampling error):由于个体变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异,称为抽样误差。 由于变异的存在,抽样研究所造成的样本均数与总体均数的差异,以及各样本均数间的差异称为均数的抽样误差。 抽样误差在抽样研究中是不可避免的,但只要严格遵循随机化抽样的原则,就能估计抽样误差的大小。 抽样实验 假设某市16岁女中学生的身高值分布服从均数?=155.4cm,标准差?=5.3cm的正态分布,即x~N(155.4,5.32)。 从该总体中以样本含量n反复进行抽样(如抽10000个样本),分别计算样本均数 ,编制频数表,绘制直方图,观察样本均数的分布。 从正态总体N(155.4,5.32)中以样本量n=10抽样10000次 从正态总体N(155.4,5.32)中以样本量n=20抽样10000次 从正态总体N(155.4,5.32)中以样本量n=30抽样10000次 从正态总体N(155.4,5.32)中以样本量n=50抽样10000次 从正态总体N(155.4,5.32)中以样本量n=100抽样10000次 抽样实验结果——样本量不同时,样本均数的标准差 抽样实验结果——总体标准差不同时,样本均数的标准差 中心极限定理和正态分布推理 中心极限定理:也称大数定理,从正态分布 总体中以固定 n 抽样时,样本均数 的分布仍服从正态分布 。 正态分布推理:当样本含量 n 足够大时,即使从偏态分布总体中以固定 n 抽样,其样本均数的分布也近似服从正态分布。 均数的标准误 样本均数的标准差(记为 ),反映的是样本均数与其总体均数之间的离散程度,即 的大小,所以可将其作为描述均数抽样误差大小的指标,称为均数的标准误。计算如下: (理论值) (估计值) 标准误小,表示抽样误差小,样本均数的代表性好;反之,标准误大,表示抽样误差大,样本均数的代表性差。 在实际工作中,可通过适当增加样本含量和减少观察值的离散程度(选择同质性较好的样本)来减少抽样误差。 均数的抽样分布—— t 分布 t 分布曲线 t分布的分位数(双侧t界值) t分布的分位数(单侧t界值) 三、总体均数的估计 (一)点估计(point estimation) (二)区间估计(interval estimation) 按照一定的概率估计总体参数可能所在的一个范围,称为区间估计。 概率——可信度,通常取 95% 或 99% 。 总体参数的范围——可信区间(confidence interval) 总体均数的区间估计 1、当?未知且n 较小时,由于 服从 t分布,可按 t 分布原理估计总体均数的可信区间。 由于 即 故总体均数(1-?)?100%的可信区间为 总体均数的区间估计 2、当?未知但n足够大时( n 100),t分布近似u分布,可以 u 界值代替 t 界值,估计总体均数的可信区间。 3、当?已知时,可按正态分布的原理,估计总体均数的可信区间。 1. 95%的可信区间的理解: (1)我们所估计的可信区间有95%的可能包含所要估计的总体参数。 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。 (3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数?。
您可能关注的文档
最近下载
- 自行车里程速度计设计论文(本科)毕业设计论文.doc VIP
- GBT3049—2006工业用化工产品铁含量测定的通用方法1,10—菲啰啉分光光度法.pdf
- 新版《建筑设计防火规范》(GB50016-2014年)规范编制组宣讲课件.ppt VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(全优).docx VIP
- 环保管家服务方案.docx VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(必刷).docx VIP
- 大数据平台数据治理规划方案.docx
- 山东文旅云智能科技有限公司笔试考啥.pdf
- 航空移动卫星通信(AMSS).ppt
- 17J008 挡土墙(重力式、衡重式、悬臂.docx VIP
文档评论(0)