- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5章 抽样推断
第 5 章 抽样推断
客观
现象
数量
表现
统计
总体
数量
特征
统计研究的程序
统计研究目的
统计设计
统
计
调
查
统
计
整
理
推
断
分
析
描
述
分
析
本章内容
第一节 抽样推断及其特点
第二节 总体参数估计
第三节 假设检验概述
学习目标
参数估计的基本原理
一个总体参数的区间估计方法
样本量的确定方法
假设检验的基本思想和原理
假设检验的步骤
总体均值及比例的检验
P值的计算与应用
用Excel进行估计与检验
要点回顾:抽样分布与总体分布的关系
结论:1. 样本均值的均值(数学期望) 等于总体均值
2. 样本均值的方差等于总体方差的1/n
抽样分布
样本均值的分布
样本比例的分布
引例:大学生每周上网花多少时间?
为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等;
问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示 ;
回答类别
人数(人)
频率(%)
3小时以下
32
16
3~6小时
35
17.5
6~9小时
33
16.5
9~12小时
29
14.5
12小时以上
71
35.5
合计
200
100
平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出估计的理论依据是什么?
统计推断的基本问题
抽样推断的基本条件
抽样推断的误差
参数估计与假设检验在统计方法中的地位
抽样推断的基本条件
1. 选择统计量—优良估计量。
2. 合适的允许误差—精确性。
3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。
抽样推断的误差
统 计 误 差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的样本统计量与总体参数在数量上的差异就是抽样实际误差。
抽样平均(标准)误差:抽样平均误差是抽样平均数的标准差,它反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均差异程度。
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代替;
用样本标准差σ(x) 或样本成数 p 替代;
对于成数,可取 P = 0.5;如果有多个 P 值,取其最接近 0.5 的P 做替代。
抽样极限(允许)误差
是样本统计量与被估计的总体参数之绝对离差的最大允许值,常用Δ表示,可简称为极限误差或允许误差。
Δ和μ的关系:
Z —概率度,Z 表示以抽样平均误差为标准单位对极限误差的度量值。由Z 确定的概率保证程度F(Z)—置信度。
误差的控制
抽样误差可计算和控制
非抽样误差的控制
调查员的挑选
调查员的培训
督导员的调查专业水平
调查过程控制
调查结果进行检验、评估
现场调查人员进行奖惩的制度
参数估计的基本方法
点估计与区间估计
评价估计量的标准
估计量:用于估计总体参数的随机变量
如样本均值,样本比例、样本方差等
例如: 样本均值就是总体均值 的一个估计量
参数用 表示,估计量用 表示
估计值:估计参数时计算出来的统计量的具体值
如果样本均值 x =80,则80就是 的估计值
估计量与估计值 (estimator estimated value)
参数估计方法简介
点估计(point estimate)
用样本的估计量的某个取值直接作为总体参数的估计值
例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计
无法给出估计值接近总体参数程度的信息
由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值
一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量
区间估计(interval estimate)
在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减允许误差而得到的
根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
区间估计的图示
将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平
表示为 (1 -
为是总体参数未在区间内的比例
常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信水平
从均值为185
文档评论(0)