- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 总体均数和总体率
第6章 总体均数和总体率的估计;第一节 均数抽样误差与t分布;抽样研究所得样本均数会不会恰好等于未知的总体均数呢?
如果固定样本含量n从同一总体中进行多次抽样,所得样本均数又会如何呢?;假设已知某地30岁-40岁正常男性血清总胆固醇的均值为5.0mmol/L,标准差为0.6mmol/L。现从该总体中进行随机抽样,每次抽取30名正常男子,并测得他们的血清总胆固醇水平,最终共抽取100份样本,并计算出每份样本的均数。;由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差(sampling error)。
抽样造成的样本均数与总体均数间的差异就称为均数的抽样误差。
在抽样研究中,抽样误差是不可避免的,但抽样误差分布具有一定的规律性。;;样本均数大部分分布在总体均数5.0的左右,中间多、两边少,左右基本对称,服从正态分布,并且样本均数的变异范围比原变量的变异范围要小很多。;样本均数的标准差称为均数的标准误,简称标准误,用符号 表示。均数的标准误说明各样本均数 围绕总体均数 的离散程度,可用来反映样本均数的抽样误差大小。;中心极限定理;从均数为?,标准差为? 的正态或偏态总体中,抽取例数为 n 的样本,样本均数的总体均数也为 ? ,标准差与原标准差成正比,与样本例数的平方根成反比。; 越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之, 越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。; 的大小与 ? 成正比,与 成反比。当?固定不变时,样本含量n增大, 减小。因此,在实际工作中,可通过适当增加样本含量来减小抽样误差。;? 常未知,用 S 估计,因此均数标准误的估计值为
;t 分布的演化; 常未知,若用 ,这时对样本均数进行的不是 Z变换而是 t 变换 ;英国统计学家 W. S. Gosset 于1908年以 “Student” 笔名发表论文,证明统计量 t 服从v = n-1的t分布;又称为Student t分布 (Student’s t-distribution);t 分布的图形及特征;t 分布的特征为:
① 以0为中心,左右对称的单峰分布
② 越小,t值越分散,峰越矮,尾越高
增大,t分布逐渐逼近Z分布, 时,t分布即为Z分布;t 界值表;单侧: 或
双侧:
即;在相同自由度时,t 的绝对值越大,P 越小
在相同 P 值时,自由度越大所对应的 t 界值越小
在相同 t 值时,双侧概率 P 为单侧概率 P 的两倍
时,t界值即为Z界值;第二节 总体均数的点估计与区间估计;区间估计的实质
假设某个总体的均数为?,需要找到两个量A和B,使得在一个比较高的可信度下 (如95%),区间(A, B)能包含? 。即
P(A ? B)=0.95;可信区间的定义
按一定的概率或可信度(1-α)估计包含未知总体参数的可能范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度 (confidence level),常取95%或99%
可信区间(CL, CU )为开区间,CL、CU 称可信限;总体均数可信区间的计算;; ?未知但n足够大(n50); 例6-3中,因n=120 , ,
,试求该地正常成年男性
血清胆固醇平均水平的95%可信区间。 ;例6-1 从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。;因n=120,属于?未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L ,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为
即(4.84,5.06)mmol/L;当σ未知n 较小;可信区间的涵义;图6-5 从N(0, 1)中随机抽样算得的100个95%可信区间(n=10);可信区间的两个要素;均数的可信区间与参考值范围的区别;第三节 总体率的点估计与区间估计;一、二项分布;二项分布的图形;当?=0.5时,分布对称;当? ?0.5,分布呈偏态;当?0.5时分布呈正偏态;当?0.5时分布呈负偏态
您可能关注的文档
- 第5章 链路性能增强技术-分集技术.pptx
- 第5章-1 数组和稀疏矩阵.ppt
- 第5章 群体心理与管理.ppt
- 第5章-中断和定时器计数器.ppt
- 第5章-1 需求和消费者行为.ppt
- 第5章专门机关.pptx
- 第5章__隶书.ppt
- 第5章 选线4.ppt
- 第5讲 现实疗法.ppt
- 第5节--风.ppt
- 2025年中国锻铁围栏市场调查研究报告.docx
- 2025年中国椭圆型市场调查研究报告.docx
- 2025年中国无蔗糖原味豆浆市场调查研究报告.docx
- 2025-2031年中国泛在电力物联网行业发展运行现状及投资潜力预测报告.docx
- 2025年中国制袋机零件市场调查研究报告.docx
- 2025年中国智能除垢型电子水处理仪市场调查研究报告.docx
- 2025-2031年中国甘肃省乡村旅游行业市场深度研究及投资策略研究报告.docx
- 2025-2031年中国干海产品行业市场发展监测及投资战略规划报告.docx
- 2025年中国全铝图解易拉盖市场调查研究报告.docx
- 2025年中国人造毛皮服装市场调查研究报告.docx
文档评论(0)