- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4抽样跟统计推论
一、非概率抽样和概率抽样: 抽样调查根据调查其抽取部分调查单位的准则不同可分非概率抽样和概率抽样。 1、非概率抽样: 抽取调查单位的原则是根据主观判断或其它操作的方便。 非概率抽样的优点:成本低、花时短、回答率高 缺点:不能做统计推论。 非概率抽样的结果是否有代表性与主观本身的水平有很大关系。 2、概率抽样: 原则:随机原则。 随机原则:在抽选调查对象时,规定了一定的程序,以保证每一个单位都有同等入选的机会,从而避免了主观因素的影响。 优点:可以作统计推论。 二、样本统计量 在简单随机抽样中,样本具有随机性,样本的参数 , s2等也会随着样本不同而不同,故它们是样本的函数,记为T(x1, x2,……, xn),称为样本统计量。 统计量的概率分布称为抽样分布(Sample distribution) 三、三种不同性质的分布 (一) 总体分布 (二) 样本分布 (三) 抽样分布 (一)总体分布(population distribution) 总体中各元素的观察值所形成的分布 分布通常是未知的 可以假定它服从某种分布 (二)样本分布(sample distribution) 一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 (三)抽样分布 (sampling distribution) 样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布的形成过程 (sampling distribution) (三)抽样分布 抽样分布:是根据“机率”的原则而成立的理论性分布, 它可以表明:由同一总体中反复不断抽取不同样本时,各个可能出现的样本统计值的分布情况。 抽样分布 Sampling distribution:从已知总体中随机地抽取含量为n的样本,研究所得样本的各种统计量的概率分布即所谓的抽样分布. 一、样本均值的分布(一个正态总体中的抽样分布) 总体服从正态分布N(m, s2), 样本均值 的抽样分布仍为正态分布,即: 例:设某村有5户人家,以下是总体家庭人口的统计表. 则有: 总体均值 =(4+5+6+7+8)/5=6人 总体标准差 = =1.4 总体方差 = =2 现从总体(N=5)中,作样本容量n=2的简单随机抽样,它可能选出的样本有5×5=25种 可能选出的全部简单随机样本 经过整理,得出样本平均家庭人口数的抽样分布如下表 样本的平均值仍等于总体平均值6 。 样本的平均值 = =(4.0 ?1+4.5 ?2+…+8.0 ? 1)/25=6 可见样本的均值平均数等于总体均值。 2.样本均值的方差 设有均值u,方差 的分布总体,如随机抽取所有可能容量为n的样本,则样本平均数的抽样分布将随着n的增大而渐渐接近于以下正态分布 N=30为大样本 n30为小样本 样本均值的抽样分布(数学期望与方差) 样本均值的数学期望 样本均值的方差:统计抽样误差是指平均误差,等于样本均值的标准差 重复抽样 不重复抽样 估计的标准误 (standard error of estimation) 当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误 以样本均值的抽样分布为例,当总体标准差?未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为 4.中心极限定理 (central limit theorem) 4.中心极限定理 (central limit theorem) 中心极限定理 (central limit theorem) 抽样分布与总体分布的关系 中心极限定理的应用 例题答案 例1,随机抽取某大学的学生100名,平均体重58kg,根据过去材料知道大学生体重的标准差为10kg,求抽样误差为多少? 解:已知n =10030 δ=10 SE= = 1kg 例2,某学院1000名学生,其平均身高是168cm,标准差为22.5cm,现从学生中随机抽出100名,求其样本平均数大于1.70m的概率。 解:已知n =100 δ=22.5 u=168 SE= =2.25 即
文档评论(0)