- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
STATISTICS;第 4 章 抽样与参数估计;学习目标;统计应用一次失败的民意调查;;为什么要进行抽样?
如何进行抽样?(抽样的方法)
用样本推断总体的科学性是什么?;4.1.1 抽样方法概述
4.1.2 概率抽样方法
4.1.3 抽样分布;4.1.1 抽样方法概述;概率抽样(probability sampling);概率抽样(probability sampling);非概率抽样(nonprobability sampling);非概率抽样(nonprobability sampling);4.1.2 概率抽样方法;简单随机抽样(simple random sampling);简单随机抽样(simple random sampling);分层抽样(stratified sampling);分层抽样(stratified sampling);分层抽样(stratified sampling);分层抽样(stratified sampling);系统抽样(systematic sampling);系统抽样(systematic sampling);系统抽样(systematic sampling);系统抽样(systematic sampling);整群抽样(cluster sampling);整群抽样(cluster sampling);本节小结;4.1.2 抽样分布;统计量是用来描述样本特征的概括性度量,比如样本均值 、比例p、方差σ2等。
统计量是样本的函数.
统计量是一个随机变量。(由于不同的样本计算出来的统计量的值是不同的)
抽样分布就是在总体给定,样本容量给定的情况下,一个样本统计量所有可能取值形成的相对频数分布。;是一种理论分布。(实际中不可能将所有样本都抽出来)
提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。
种类:样本均值的抽样分布, 样本比例的抽样分布,样本方差的抽样分布等。 ;容量相同的所有可能样本的样本均值的概率分布(相对频数分布)。
进行推断总体均值?的理论基础 ;;;样本均值的抽样分布 (例题分析);样本均值的抽样分布 (例题分析);样本均值的分布与总体分布的比较 (例题分析);;;;;样本均值的数学期望
样本均值的方差
重复抽样
不重复抽样;总体(或样本)中具有某种属性的单位与全部单位总数之比
不同性别的人与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例可表示为
样本比例可表示为
;在重复选取样本量为n的样本时,由样本比例的所有可能取值形成的相对频数分布。
当样本容量很大时,样本比例的抽???分布可用正态分布近似。
若np≥5和n(1- p )≥5,就可认为样本量足够大。;样本比例的数学期望
样本比例的方差
重复抽样
不重复抽样;统计量的标准误;统计量的标准误; 4.2.1 估计量与估计值
4.2.2 点估计与区间估计;4.2.1 估计量与估计值;参数估计(parameter estimation)就是用样本统计量去估计总体的参数
估计量:用于估计总体参数的统计量的名称
如样本均值,样本比例,样本方差等
例如: 样本均值就是总体均值? 的一个估计量
参数用? 表示,估计量用 表示
估计值:估计参数时计算出来的统计量的具体值
如果样本均值 ?x =80,则80就是? 的估计值;4.2.2 点估计与区间估计;点估计 (point estimate);;;区间估计的图示;区间估计的图示;区间估计 (interval estimate);一般地,如果将构造置信区间的步骤重复很多次,所有可能构建的区间中能够包含真实总体参数的区间个数占所有可能区间的比例称为置信水平 。也称为置信度或置信系数。(前面的95%就是一个置信水平)
一般来说,置信度可以用(1-α)×100%表示,其中α是区间估计的显著性水平,是所有可能构建的区间中不包含真实总体参数的区间个数占所有可能区间的比例。 α的取值大小由实际问题确定。经常取??为0.01,0.05,0.10,相应的常用置信水平为 99%, 95%, 90%。;由样本估计量构造出的总体参数在一定置信水平下的估计区间
统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述;总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数
实际估计时往往只
文档评论(0)