- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 * 第5章 统计推断:估计与假设检验 5.1 统计推断的含义 5.2 估计和假设检验:统计推断的两个孪生分支 5.3 参数估计 5.4 点估计量的性质 5.5 统计推断:假设检验 5.6 总结 5.1 统计推断的含义 统计推断研究的是总体与来自总体的样本之间的关系。 统计推断就是通过样本的信息去推知关于总体的信息。 例:表5-1 2004年2月2日纽约股票交易市场上 28家上市公司的价格收益比数据。(样本) 假定这是一个来自NYSE上约3000家上市公司(总体)的随机样本。 能否说这28支股票的P/E值就是NYSE所有上市公司的平均的P/E值呢? 已知样本均值能否得到总体均值? 例 表5-1 纽约股票交易市场上28家上市公司的价格收益比(P/E) 公司 P/E 公司 P/E AA 27.96 INTC 36.02 AXP 22.9 IBM 22.94 T 8.3 JPM 12.1 BA 49.78 JNJ 22.43 CAT 24.68 MCD 22.13 CAT 14.55 MRK 16.48 KO 28.22 MSFT 33.75 DD 28.21 MMM 26.05 EK 34.71 MO 12.21 XOM 12.99 PG 24.49 GE 21.89 SBC 14.87 GM 9.86 UTX 14.87 HD 20.26 WMT 27.84 HON 23.36 DIS 37.1 均值=23.25,方差=90.13,标准差=9.49 5.2 估计和假设检验:统计推断的两个孪生分支 在实际中最常见也是最重要的两类统计推断问题是:参数估计与假设检验。 参数估计是统计推断的第一步,通常通过样本来估计总体某一参数,这一估计量的取值称为参数估计值。 假设检验是指可以对某一参数的假定值进行先验判断或预期,然后利用小概率原理对其进行检验,得到接受或拒绝原假设的结论。 5.3 参数估计 根据样本信息对总体中的未知参数做出估计的过程称为参数估计问题。 估计问题有两类:点估计(point estimation)和区间估计(interval estimation)。 假定有来自某一总体X,容量为n的随机样本,可将样本均值作为总体均值(期望)的估计量;样本方差作为总体方差的估计量。这就是点估计。 区间估计是指要估计出一个区间,使得这个区间包含真实参数的概率达到事先给定的置信水平(置信系数confidence coefficient) 。 概念: 置信系数confidence coefficient,置信度,置信水平,1-α α称为显著水平 level of significance ,犯第一类错误的概率 一般地,假定总体X是一服从某一概率分布的随机变量,要对其参数进行估计,可以按照下面步骤进行: (1) 从总体中抽取容量为n的随机样本 (2) 寻找与待估参数有关的统计量 (3) 查表得到该统计量的置信上限和置信下限 (4) 通过待估参数与统计量的关系换算得到待估参数的置信上限与置信下限。 (5)代入相应的样本值即可得具体的置信区间。 5.4 点估计量的性质 1. 线性(linearity) 2. 无偏性(unbiasedness) 3. 最小方差性(minimum-variance) 4. 有效性(efficiency) 5. 最优线性无偏估计量(BLUE) 6. 一致性(consistency) 在实践中,样本均值是度量总体均值时使用最广泛的统计量,因为样本均值满足以上统计性质。 线性 若估计量是样本观察值的线性函数,则称该估计量为线性估计量。 显然,样本均值是一个线性估计量。 无偏性 如果平均而言,估计量与参数的真实值相一致,就称该估计量是无偏估计量。(如图5-3) 即当估计量的期望值等于参数值时,估计量为无偏估计量。 即 例5-1:若总体服从正态分布,从中得到一个样本容量为n的简单随机样本。则样本均值是总体真实均值的无偏估计量;如果从正态总体中重复抽取n个样本,并计算每个样本的样本均值,则平均而言,样本均值等于真实的总体均值。但需要谨慎的是,我们不能仅通过一个样本就认为计算的样本均值就一定与真实的均值相一致。 5 有效性 如果有几个估计量都是无偏估计量,我们可以考察这些估计量的方差,方差最小的估计量称为有效估计量。 5-5 最优线性无偏估计量 线性、无偏,且
文档评论(0)