- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章参数统计第一节统计推论一、定义统计推论是根据局部资料.ppt
第六章 参数统计 第一节 统计推论 一、定义:统计推论是根据局部资料(样本资料)对总体的特征进行推断。 二、特点 (一)局部资料的特性某种程度上能反映总体的特性; (二)一次抽样的结果不能恰好就等于总体的结果 三、内容 (一)通过样本对总体的未知参数进行估计,即参数估计。 (二)通过样本对总体的某种假设进行检验,即假设检验。 第二节 名词解释 一、总体即研究对象的全体。 二、样本与简单随机样本 样本:从总体中按一定的方式抽出的那一部分。 样本大小或样本容量:样本中包含的个体数目n。 简单随机样本:被抽样的数据不但是随机变量,而且相互独立,遵从同一分布(即同总体所遵从的分布)。 三、统计量 从总体中抽取容量为n的样本,可以看做n个独立同总体的分布的随机变量,ξ1,ξ2,...,ξn。那么,随机变量ξ1,ξ2,...,ξn的任何函数f(ξ1,ξ2,...,ξn)也是随机变量。我们把函数f(ξ1,ξ2,...,ξn)叫做统计量。 根据随机变量ξ1,ξ2,...,ξn的观测值x1、x2,...,xn计算得到的一切统计数字特征(如均值、方差)可以看做是相应的统计量的观测值。 如样本均值 第三节 参数的点估计 参数估计,根据抽样结果来合理地、科学地猜一猜总体的参数大概是什么?或者在什么范围? 其一,点估计。即用样本计算出来的一个数来估计未知参数。 其二,区间估计。通过样本计算出一个范围来对未知参数进行估计。 例1:从某城市的贫困人口中随机抽取的234人,计算出平均年龄 岁,年龄分布的标准差S=12.3岁。求该城市贫困人口总体的平均年龄和年龄分布的标准差。 解:根据点估计值的定义,可以认为该城市贫困人口的平均年龄μ=47.2岁,年龄分布的标准差为σ=12.3岁。 例2:某省人口数为3813万人,从中随机抽取了70405人,其中残疾人4028人。求该省残疾人的总数。 解:样本中残疾人的频率 可以认为总体残疾人的频率Π=0.0572 因此,该省残疾人的总数为: N=0.0572×3813=218.1(万人) 即该省残疾人总数为218.1万残疾人。 第四节 抽样分布 抽样分布:从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得的样本的各种统计量的概率分布。 一、样本均值的分布 1、总体标准差已知时,样本均值的分布服从μ分布(正态分布) 从均值为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本, 则 由此可知,样本均值是一服从正态分布的随机变量,记为 将均值标准化,则 ,其中标准化的分母为均值的标准误。 2、总体标准差未知,样本均值的分布服从t分布 σ未知时,可用样本标准差s代替,标准化变量并不服从正态分布,而服从具有n-1自由度的t分布 ,其分母为样本标准误差。 自由度:独立观测值的个数。在这里因为计算s时,所使用的n个观测值,受到平均数x的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。 二、样本方差 的分布—— 分布 从方差为 的正态总体中,随机抽取含量为n的样本,可计算出样本方差 。在讨论样本方差 的分布时,通常并不直接谈 的分布,而是将它标准化,得到一个不带任何单位的纯数。该纯数服从n-1自由度的卡方分布。 ~ 第五节 总体特征值的区间估计 原因:用样本观察值计算的点估计值与总体特征值的距离有多大不知道,同时,点估计值与总体特征值完全相同的概率极小,用点估计值来估计总体特征值几乎必然犯错误。因此,我们希望估计出一个范围,并且希望知道这个范围包含总体特征值的可能性有多大。 区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。 包括两部分内容:一是这一可能范围的大小;二是总体指标落在这个可能范围内的概率。 公式: 设总体的未知参数为Q,由样本观察值计算的点估计值为 对于给定的α(0α1),满足 一、正态总体均值的区间估计 如果总体分布满足ξ~N(μ, )。μ的区间估计,根据 是否为已知,分为以下两种统计量进行讨论: (一) 为已知 公式为 例1: 例:包糖机某日开工包了12包糖,称得质量(单位:克)分别为506,500,495,488,504,486,505,513,521,520,512,485.假设重量服从正态分布,且标准差为σ=10.试求糖包的平均质量μ的1-α置信区间(分别取值α=0.10和α=0.05)。 解:σ=10,n=12, 计算得 (1)当α=0.10时,1-α/2=0.95, 查表得Zα/2=Z0.05=1.645 即μ的置信度为90%
文档评论(0)