- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 总体均数的估计与假设检验 几个概念: 1、抽样研究 2、统计描述 3、统计推断 基本内容 第一节 均数的抽样误差与标准误 抽样误差:样本统计量与参数之间的差异,称抽样误差。 样本统计量是一个随机变量,在随机的原则下从同一总体抽取不同的样本,即使每个样本的样本含量n相同,它们的结果也会不同。 样本统计量与参数之间的差异有何特点呢? 二个特点: A、其值互不相同,有些样本统计量与总体参数之间差异大,有些小;有些为正数,有些为负数。 B、这些差异虽然客观存在,但却未知,因为总体参数的具体值我们往往未知。 由于以上特点,我们该如何去考虑抽样误差的大小呢? 例3-1 若某市1999年18岁男生身高服从均数 =167.7cm、标准差 =5.3cm的正态分布。从该正态分布N(167.7,5.32)总体中随机抽样100次即共抽取样本g=100个,每次样本含量nj=10人,得到每个样本均数 及标准差Sj 如图3-1和表3-1所示。 样本统计量的标准差(方差),从平均的意义上说明了样本统计量与总体参数的差异状况,故常用它来衡量抽样误差的大小。 为区别一般变量的标准差,常把样本统计量的标准差称为标准误(standard error) 在此,我们只讨论样本均数的分布及其抽样误差的计算。 样本均数的抽样分布特点: 1)来自正态总体的样本均数,其分布为正态分布,其均数为原变量的均数,其方差为原变量方差的 1/n 倍。 2)来自偏态总体的样本均数,若n大,则样本均数近似于正态分布。否则,样本均数为偏态分布。 若 X ~ N(μ, ) 则 ~ N(μ , ) 若X服从偏态分布,n小, 服从偏态分布; 均数为μ方差为 ; 当n大时, 近似服从正态分布。 即 ~ N(μ, ) 问题: 已知健康成年男性身高(厘米)X ~ N(170, 62), 现从该总体进行n=36的抽样,求样本均数落在 168.04—171.96间的概率? 第二节 t 分布 小样本思想 戈塞特:t分布与小样本 由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性” 一、t 分布的概念:小样本的概率分布 与正态分布比较,反应抽样误差分布的规律。 (规律来源的公式解释): 二、t 分布图形: 三、t 分布面积特征( t界值表): ~ N(μ, ) 故: t分布图形: 1)t值的分布与自由度有关,t分布是一簇曲线。 2)单峰分布,以0为中心,形状类似标准正态分布。 3)自由度越小,曲线的峰部越矮,尾部越粗。 4)当自由度为无穷大时,t分布即为标准正态分布。 第三节 总体均数的估计 参数估计的概念:指用样本指标(统计量)估计总体指标(参数);有点估计和区间估计两种。 这种估计通常是在信息不完全、结果不确定的情况下作出的。 参数估计提供了一套在满足一定精确度要求下根据部分信息来估计总体参数的真值,并作出同这个估计相适应的误差说明的科学方法。 总体均数的估计量: 样本平均数 point estimation: Interval estimation: 考虑抽样误差 总体均数可信区间的计算 A、单个正态总体均数的可信区间 总体均数可信区间的计算 例3-2 在例3-1中抽得第15号样本的均数 =166.95,标准差S=3.64cm,求其总体均数的95%可信区间。 n=10人, S = =1.1511(cm) =n-1=10-1=9, t0.05/2,9=2.262。 其95%可信区间: (166.95-2.262 1.1511,166.95+2.262 1.1511) 即(164.35, 169.55)(cm)。 例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的双侧95%可信区间。 本例n>60,故可采用正态近似法 今n=200, =3.64、S=1.20、S =0.0849,u0.05/2=1.96。 (3.64-1.96 0.0849,3.64+1.96 0.0849) 即(3.47,3.81)( mmol/L)。 B、两总体均数之差的可信区间 从总体标准差相等,但总体
文档评论(0)