- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 参数估计基础
统计推断:用样本信息推断总体特征,包括参数估计和假设检验。
图示:总体与样本
Population
μ
sample2
sample1
sample3
sample4
sample5
抽样试验(n=5)
抽样试验(n=10)
抽样试验(n=30)
1000份样本抽样计算结果
总体的均数
总体标准差s
均数的均数
均数标准差
n=5
5.00
0.50
4.99
0.2212
0.2236
n=10
5.00
0.50
5.00
0.1580
0.1581
n=30
5.00
0.50
5.00
0.0920
0.0913
3个抽样实验结果图示
① 各样本均数未必等于总体均数;
② 各样本均数间存在差异;
③ 样本均数的分布为中间多,两边少,左右基本对称。
④ 样本均数的变异范围较之原变量的变异范围大大缩小。
样本均数的抽样分布具有如下特点
中心极限定理:
(1)从正态总体中作随机抽样,则样本均数服从正态分布;从偏态总体中作随机抽样,样本含量n足够大(n>30)则样本均数近似服从正态分布。
(2)从总体均数为μ,标准差为σ的正态总体中抽取例数为n的样本,样本均数的总体均数为μ,标准差为 。
样本频率的抽样分与抽样误差
黑球的比例为20%,重复摸球50次,计算摸到黑球的频率?
黑球比例(%)
样本频数
样本频率(%)
黑球比例(%)
样本频数
样本频率(%)
8
2
2.00
22
11
11.00
10
4
4.00
24
11
11.00
12
8
8.00
26
6
6.00
14
7
7.00
28
3
3.00
16
11
11.00
30
4
4.00
18
13
13.00
32
1
1.00
20
19
19.00
合计
100
100.00
表6-3 π=20%的随机抽样结果(n=50)
一、抽样误差与标准误
1.抽样误差:由于抽样造成的样本统计量与总体参数以及样本统计量与样本统计量之间的差异。
抽样误差是不可避免的,但可以估计。
2.标准误(Standard error,SE):标准误为样本均数的标准差,用 表示,是说明样本均数抽样误差的大小的指标,描述样本均数的离散程度,反映用样本均数估计或推断总体均数的可靠性。
3.标准误的计算
均数的标准误与标准差成正比,与样本例数的平方根成反比。
若标准差固定不变时,可增加n而缩小抽样误差。
对于二项分布,X~B(n,π),
则样本频率
其标准误:
实际中, π一般未知,
常用样本频率p近似代替
则其标准误:
4. 标准误的应用
(1)表示抽样误差大小,描述(n相同)样本统计量的离散程度,反映用样本统计量估计或推断总体参数的可靠性;
(2)用于估计总体参数的可信区间;
(3)用于进行样本均数/频率的假设检验。
二、t 分布的概念
式中 为自由度(degree of freedom, df)
3.实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。
4. t 分布曲线的特征:
(1)t 分布是一簇曲线。它受自由度的影响,自由度不同曲线形状不同。
(2)ν是t 分布曲线的参数:
n越小,ν越小,曲线越平缓
n越大,ν越大,曲线越陡峭
n→∞,曲线近似于标准正态分布曲线。
(3)以0为中心,左右对称呈钟形。
(4)标准正态分布是t 分布的特例。
三、总体参数的估计
1.参数估计:用样本统计量估计总体参数。包括点估计和区间估计。
(1)点估计(Point Estimation):直接用样本指标作为总体参数的估计;
(2)区间估计(Interval Estimation) :用预先给定的概率(可信度、把握度1-α)估计总体参数所在的范围。此范围称为置信区间(可信区间):Confidence Interval, CI
1.点估计(point estimation)
用相应样本统计量直接作为其总体参数的估计值。
、S估计
其方法虽简单,但未考虑抽样误差的大小。
按预先给定的概率(1)所确定的包含未知总体参数的一个范围。
总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。
如给定=0.05,该范围称为参数的95%可信区间或置信区间;
如给定=0.01,该范围称为参数的99%可信区间或置信区间。
2.区间估计(interval estimation):
总体均数置信区间的计算需考虑:
(1)总体标准差是否已知,
(2)样本含量n的大小
通常有两类方法:
(1
文档评论(0)