社会统计学第四讲.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会统计学第四讲

(C)GUOH 2006 社会统计学 2006年4月3日 主要内容 统计推论的基础知识 参数的点估计 参数的区间估计 小样本的区间估计 大样本的区间估计 课本映射:第六章:第一节、第二节、第三节第一条、第四节第一条、第五节第一、二条、第六节 统计推论的基础知识 推论统计(statistical inference)是根据局部资料对总体的特征进行推断。 推论统计主要包括两大部分: 参数估计(parameter’s estimation):通过样本对总体的未知参数进行估计; 假设检验(hypothesis test):通过样本的情况对总体的某种假设进行检验。 参数的点估计 参数的点估计:用样本计算出来的一个统计值来估计总体的未知参数。 总体参数的点估计: 总体均值μ的点估计为样本均值x bar; 总体方差σ2的点估计为修正后的样本方差s2; 总体成数的点估计为样本成数p hat。 参数的区间估计 点估计的缺陷: 由于总体参数值未知,点估计无法表明用于估计总体参数的统计值到底与总体参数相差多少。 如何提高估计的精度? 公园套圈游戏的启示。 中心极限定理:一定样本量条件下,样本均值的抽样分布趋近正态分布。 参数的区间估计 根据正态分布的图形特征: “68-95-99规律” X bar出现在[μ-1.96σx bar,μ+1.96σx bar]的概率为95% 参数的区间估计 在样本均值的抽样分布中,x bar为变量,同样的x bar+/-1.96σx bar也为一个变量。 那么有95%的可能这个依据样本统计值建立的区间会包含总体均值,5%的可能性不包括均值。 以n为样本量,以100次抽样的样本均值计算区间,其中有95个会包含总体均值,5个不包含。 http://www.kuleuven.ac.be/ucs/java/ 这种通过统计值计算得到的区间对参数值进行估计的方式称为区间估计。 参数的区间估计 区间估计的一般表达式: Q hat: 参数值Q的点估计值; ε: 1-α:称为置信度,表示区间估计包含总体均值的概率,即区间估计可信程度。 参数的区间估计 α:称为显著性水平或显著度(significance level)即容许区间估计不包括总体均值的概率大小,也是区间估计的错误大小。 社会学中常用0.05作为显著度。 区间估计得出的区间称为置信区间(confidence interval)。 参数的区间估计 置信区间与置信度的关系: 置信区间越大,置信度越高; 置信区间越小,置信度越低。 置信区间越大,置信度越高,但同时置信区间的效用降低了。 参数的区间估计 置信区间与显著度的关系: 置信区间可以为单侧区间,但一般考虑双侧区间。 因为总体参数可能在样本统计值的左边,也可能在样本统计值的右边。在双侧区间的情况下,显著度α要除以2才能找到区间的临界点, 小样本的区间估计 小于30个样本的抽样称为小样本,在社会科学里小于50个样本的抽样称为小样本。 已知总体方差的情况下: 小样本的区间估计 设某社区妇女从事家务劳动时间服从正态分布,劳动时间的方差为0.662。根据三十六人的随机抽样调查显示,三十六人每天平均从事家务劳动的时间为2.65小时,求该社区妇女每天平均从事家务劳动的时间的双侧置信区间。(α=0.05) 已知:σ=0.66 1-α=0.95 Zα/2=+/-1.96 n=36 P(2.65-1.96*0.66/sqrt(36)≤μ≤2.65+1.96*0.66/sqrt(36))=0.95 P(2.4344≤μ≤2.8656)=0.95 小样本的区间估计 以0.05为显著度,该社区妇女每天从事家务劳动的时间的均值的置信区间为[2.43,2.87] 总体方差未知: 可以使用样本方差代替总体方差,此时样本均值的抽样分布满足自由度为k=n-1的t分布。 小样本的区间估计 某社区人口受教育程度服从正态分布,根据二十五人的随机抽样调查,平均受教育年限为11.5年,标准差为3.6年,求该社区人口平均受教育年限的双侧置信区间。(α=0.01) 已知:1-α=0.99, K=24, tα/2=2.7969 n=25 小样本的区间估计 P(11.5-2.7969*3.6/sqrt(25)≤μ≤11.5+2.7969*3.6/sqrt(25))=0.99 P(9.4862≤μ≤13.5138)=0.99 以0.01为显著度,该社区人口平均受教育年限的双侧置信区间为[9.5,13.5] 练习: 为测量某学校学生的IQ进行了49人的随机抽样调查,发现平均IQ为105分,已知该学校学生的IQ标准差为15分,求以0.01为显著度该学校学生IQ均值的双侧置信区间。 [99.471,110.529] 小样本的区间估计 在某公司进行的一次有关年收入的随机抽样调查发现,在被

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档