- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[高等教育]信息分析与决策Chapert4-1 抽样与统计推断1-估计与参数检验
第四章 样本数据的统计分析
在实际问题中,人们常常可以大致判断出总体分布的类型,但却难以直观地判断出总体分布的参数(均值,方差等)。这就需要用样本来推断总体分布的这些参数,即所谓的参数估计。
参数估计
4.1 估计
参数估计Estimation,即运用抽样数据来估计总体参数的值。分为点估计(Point estimates)和区间估计(Interval estimates).
4.1.1 点估计
点估计,用样本的某一函数值来估计总体分布中的未知参数。
4.1.1 点估计
每个点估计都与总体参数不同,若估计量的期望值等于总体参数,则这个估计量被称为无偏估计量。否则,则是有偏的。上表中的估计量都是无偏的。因此关于总体参数的有关决策也都是由意义的。
4.1.1 点估计
4.1.1 点估计
Ex: 不同年龄组的人周看电视的统计数据
Age Group
Sample Mean
Sample Deviation
Std. Deviation
18-24
60.16
101.91
10.09
25-34
70.28
97.06
9.85
35-44
67.40
40.30
6.35
45-54
89.06
122.36
11.06
55-64
95.93
175.57
13.25
65+
117.05
32.37
5.69
18-24年龄组看电视均值小于25-34年龄组的人,但却有较大的标准差和方差。65岁以上的人的看电视时间最多,但方差最小。是否能够直接用这些点估计的值解释说明问题?
4.1.2 区间估计
即使是无偏的点估计,在一次估计中,都与总体参数(真值)有偏差。所谓“无偏”,是指在大量重复抽样基础上的均值,是无偏的。因此,需要估计点估计对总体参数的偏差。即,根据估计量的分布,在一定概率下,给出总体参数的可能范围。
置信区间
若总体分布含一个未知参数,找出了两个依赖于样本Xi(i=1,2,…,n) 的估计量1 2使,
P(1 2) = 1-
其中(0,1),则称随机区间(1,2)为的100(1-)%的置信区间。百分数100(1-)%称为置信度。
均值的置信区间
均值的置信区间
方差的置信区间
比例的置信区间
某类个体数量占总体数量的比例问题是社会科学,自然科学领域中机场遇到的问题。Ex,
高收入人数的比例
开展电子商务的企业的比例
某种药物有疗效的比例
因此,具有不同特征的个体数量的比例问题,是我们研究一个系统(特别是包含人的系统) 结构的基本问题。
比例的置信区间
比例的置信区间
比例的置信区间
比例的置信区间
比例的置信区间
Ex: 如果1000(n=1000)个选民的样本,在两个候选人的角逐中,有51%(π=51%)的选票支持候选人A,则置信度为90%(a/2=0.05)的置信区间为:
比例的置信区间
若样本足以代表总体投票的情况,则倾向于候选人A的选民的比例在48.4%到53.6%之间的可能性为90%。这意味着尽管点估计表明了投票的多数情况51%,但由于样本数据的不确定性,真实的支持比例可能低于50%。
4.1.3 置信区间与样本量
在关于置信区间的所有公式中,样本量对于决定区间大小起关键性作用。在抽样研究前,往往需要确定抽取样本的大小,从而在设定的精确水平的范围内估计总体参数。
4.1.3 置信区间与样本量
4.1.3 置信区间与样本量
4.1.3 置信区间与样本量
4.2 假设检验
4.2.1 假设检验的基本概念
假设检验分为参数检验与非参数检验
参数检验:已知总体分布且猜到总体的某个参数(假设H0),用一组样本来检验这个假设,是否正确(接受还是拒绝假设H0)
非参数检验:猜出总体分布(假设H0),用一组样本来检验这个假设,是否正确。
4.2.1 假设检验的基本概念
Ex: 生产线上生产出来的零件,已知零件的直径服从正态分布,抽取4个样本,直径分别为(10.1,9.9,9.91,10.09),其样本的均值为10。
我们推断总体的均值也为10.
这个推断是否正确?
我们需要另外一组样本来检验。
4.2.1 假设检验的基本概念
4.2.2 正态总体下参数假设检验
4.2.2 正态总体下参数假设检验
4.2.2 正态总体下参数假设检验
若统计量在(-k,k)之间,则接受假设H0, 若在k的外侧,则拒绝假设H0
4.2.2 正态总体下参数假设检验
假设检验的等价判别方法:
对于双尾检验定义统计量z的等价的p值为 p = 2*(1-P(Zz)),
若z 不在拒绝域内
Zϵ(-Za/2,Za/2),
等价于p a,
这种情况下,
即接受假
文档评论(0)