5终身模块统计学抽样误差假设检验.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量资料的统计推断 statistical inference of measurement data;统计推断:参数估计,假设检验 “世上有三种哄人的东西:谎言、该死的谎言、统计数据”----英国政治家迪斯雷里。 “世上有三样激动人心的东西:宣传、要命的宣传、统计数据”。 ;均数的抽样误差和标准误;均数的抽样误差sampling error of mean 概念: 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差。 即:;1 2 中心极限定理:如果随机变量的总体均数及方差有限,当样本容量趋于无穷大时,样本均数的分布趋近于均数为总体均数,方差为 的正态分布。 ;如何估计? 用样本均数的标准差来估计,称标准误(standard error)。 标准误越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。 计算公式: 即:由总体标准差,样本例数求得。但通常以样本标准差作为总体标准差的估计值。因此: ;与标准差的区别: 标准差:表示一般变量值的离散程度;均数标准误特别说明样本均数这一变量值离散程度的指标。 标准误的应用: (1)用来衡量抽样误差的大小,标准误越小,样本均数与总体均数越接近,样本均数的可信度越高; (2)结合标准正态分布与 t 分布曲线下的面积规律,估计总体均数的置信区间。 (3)用于假设检验。;假定2003年汕头市15岁女学生的身高(cm)服从N(155.4, 5.32)。用计算机做抽样模拟试验,每次抽出10个数字,组成一个样本,求出样本均数 、样本标准差 S。 再求得此100个样本均数的均数、样本均数的标准差(标准误)。 100个样本均数构成一个新的分布,也是正态分布(即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布)。新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示N( , ) 。各样本均数的均数等于总体均数。;正态总体中抽样(样本量5);t 分布(t-distribution);u分布: u转换 将正态分布转换为标准正态, N(0, 1)。同理:将样本均数的分布 也可以转换为标准正态分布 即: 实际工作中,总体标准差往往未知,常用S代替σ 计算标准误,因此:就变为: ;也就是说:;均数的分布也是这样;但是,条件发生变化;t分布是一簇对称于0的单峰分布曲线。自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大, t分布曲线逐渐逼近于标准正态分布曲线。当自由度无穷大时, t分布就是标准正态分布曲线。 每一条t分布曲线,都对应于相应的自由度。;t分布曲线下的面积规律: 与标准正态曲线下的面积规律相似:在某一个自由度下,两侧外部总面积为5%的界限的t值称为t0.05/2(υ),把两侧外部总面积为1%的界限的t值称为t0.01/2(υ)。 中部占95%面积的t值范围: t0.05/2(υ)-- t0.05/2(υ), 中部占99%面积的t值范围: - t0.01/2(υ)-- t0.01/2(υ)。;当自由度确定时,占一定面积的t界限值,可以查表得出。参考附表6(p436)。 例如:查当自由度=20,两侧概率之和为0.05时,对应的t值: t0.05/2(20)=2.086, 单侧概率为0.05时,对应的t值: t0.05(20)=1.725, ;t分布的主要应用: (1)总体均数置信区间估计; (2)t检验;;使用t值表注意: 同一自由度下, P越小,t值越大;P值相同时,自由度越大,t越小;当自由度无穷大时,t值与u值相等。这也是u分布与t分布的区别。 ;总体均数置信区间的估计;参数估计: 点估计(point estimation):用样本统计量作为对总体参数的估计值(μ) 。比如均数的估计。 区间估计(interval estimation):根据选定的置信度估计总体均数所在的区间(aμ b) . a, b 为置信限(可信限)。;为何要进行区间估计? 点估计是用样本均数来估计总体均数,简单易行,但未考虑抽样误差,而后者又是不可避免的。故常按照一定的概率估计总体均数在哪个范围。 置信度(confidence level): 在估计总体均数的置信区间时,如果可能估计错误的概率为α ,那么估计正确的概率为1-α , 即为置信度. 常用: 95%, 99%. 置信区间(confidence in

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档