第6章 总体均数和总体率.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 总体均数和总体率

第6章 总体均数和总体率的估计;第一节 均数抽样误差与t分布;抽样研究所得样本均数会不会恰好等于未知的总体均数呢? 如果固定样本含量n从同一总体中进行多次抽样,所得样本均数又会如何呢?;假设已知某地30岁-40岁正常男性血清总胆固醇的均值为5.0mmol/L,标准差为0.6mmol/L。现从该总体中进行随机抽样,每次抽取30名正常男子,并测得他们的血清总胆固醇水平,最终共抽取100份样本,并计算出每份样本的均数。;由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差(sampling error)。 抽样造成的样本均数与总体均数间的差异就称为均数的抽样误差。 在抽样研究中,抽样误差是不可避免的,但抽样误差分布具有一定的规律性。;;样本均数大部分分布在总体均数5.0的左右,中间多、两边少,左右基本对称,服从正态分布,并且样本均数的变异范围比原变量的变异范围要小很多。;样本均数的标准差称为均数的标准误,简称标准误,用符号 表示。均数的标准误说明各样本均数 围绕总体均数 的离散程度,可用来反映样本均数的抽样误差大小。;中心极限定理;从均数为?,标准差为? 的正态或偏态总体中,抽取例数为 n 的样本,样本均数的总体均数也为 ? ,标准差与原标准差成正比,与样本例数的平方根成反比。; 越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之, 越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。; 的大小与 ? 成正比,与 成反比。当?固定不变时,样本含量n增大, 减小。因此,在实际工作中,可通过适当增加样本含量来减小抽样误差。;? 常未知,用 S 估计,因此均数标准误的估计值为 ;t 分布的演化; 常未知,若用 ,这时对样本均数进行的不是 Z变换而是 t 变换 ;英国统计学家 W. S. Gosset 于1908年以 “Student” 笔名发表论文,证明统计量 t 服从v = n-1的t分布;又称为Student t分布 (Student’s t-distribution);t 分布的图形及特征;t 分布的特征为: ① 以0为中心,左右对称的单峰分布 ② 越小,t值越分散,峰越矮,尾越高 增大,t分布逐渐逼近Z分布, 时,t分布即为Z分布;t 界值表;单侧: 或 双侧: 即;在相同自由度时,t 的绝对值越大,P 越小 在相同 P 值时,自由度越大所对应的 t 界值越小 在相同 t 值时,双侧概率 P 为单侧概率 P 的两倍 时,t界值即为Z界值;第二节 总体均数的点估计与区间估计;区间估计的实质 假设某个总体的均数为?,需要找到两个量A和B,使得在一个比较高的可信度下 (如95%),区间(A, B)能包含? 。即 P(A ? B)=0.95;可信区间的定义 按一定的概率或可信度(1-α)估计包含未知总体参数的可能范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度 (confidence level),常取95%或99% 可信区间(CL, CU )为开区间,CL、CU 称可信限;总体均数可信区间的计算;; ?未知但n足够大(n50); 例6-3中,因n=120 , , ,试求该地正常成年男性 血清胆固醇平均水平的95%可信区间。 ;例6-1 从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。;因n=120,属于?未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L ,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为 即(4.84,5.06)mmol/L;当σ未知n 较小;可信区间的涵义;图6-5 从N(0, 1)中随机抽样算得的100个95%可信区间(n=10);可信区间的两个要素;均数的可信区间与参考值范围的区别;第三节 总体率的点估计与区间估计;一、二项分布;二项分布的图形;当?=0.5时,分布对称;当? ?0.5,分布呈偏态;当?0.5时分布呈正偏态;当?0.5时分布呈负偏态

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档