第一章绪论(二)概率统计相关知识资料.ppt

下载文档 降价啦

6
0
约1.41万字
约 127页
2016-11-04 发布于湖北
举报
版权申诉
保障服务

第一章绪论(二)概率统计相关知识资料.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

3.3 有效性即对大样本而言，样本均值和样本中位数均服从均值为?x 的正态分布，但样本中位数的方差是样本均值的方差的( ?/2)倍。根据有效性的性质，用样本均值估计?x比用样本中位数Xmid更准确，即样本均值提供了一个比样本中位数更为准确的总体均值的估计值。 3.4 最优线性无偏估计量最优线性无偏估计量：如果一个估计量是线性的和无偏的，并且在参数的所有线性无偏估计量中，这个估计量的方差最小，则称这个估计量是最优线性无偏估计量。显然，该性质包括了线性、无偏性和最小方差性。 3.5 一致性假定X~N(?x ，?2)，从该正态总体中抽取一容量为n的随机样本。现考虑?x的两个估计量：第一个估计量是常用的样本均值，则 E( ) = ?x 。可以证明，显然第二个估计量X*是一个有偏估计量。两个估计量的差别在于前者的分母是n而后者的分母是n+1。但是，假定我们增大样本容量，则随着样本容量的增大，第二个估计量X*的均值也将近似等于真实的?x ，在统计学中，我们成这样的估计量（如X*）为一致估计量。有时得不到无偏估计量，但却可以得到一个一致估计量。 ?x n=100 n=80 n=50 n=25 概率密度 f(X*) 随着样本容量的增大，总体均值估计量X*的变化示意图 §4、假设检验在观测值组成的随机样本，建立了?x 的一个95%的置信区间。即在该区间内包括?x 的概率为95%。假设真实的?x 取某一特定值，如?x =13。然后去检验这个假设，检验结果是接受或拒绝该假设？下面以此为例说明。 6 7 8 9 10 11 12 13 14 15 16 18 P/E 频数 2 2 5 6 5 7 5 4 3 4 6 1 均值=11.5 样本方差=9.2755 样本标准差=3.0456 中位数=众位数=11 总计：50 假设的样本（50支股票的P/E值）用假设的语言，将?x =13称为零假设，用符号H0表示。即，H0: ?x =13 与零假设相对应的是备择假设，用符号H1表示，备择假设有以下几种形式： H1： ?x＞13 称为单边备择假设； H1： ?x＜13 称为单边备择假设； H1： ?x≠13 称为双边备择假设。为了检验零假设（和备择假设）,根据样本数据及统计理论建立判定规则来判断样本信息是否支持零假设。若支持，不拒绝零假设，反之拒绝零假设，接受备择假设。建立判定规则有两种方法：置信区间法、显著性检验法。 4.1 置信区间法在上述例子中，我们知道样本均值服从均值为?x ，方差为?2/n的正态分布，由于真实的方差未知，以样本方差代替。在这种情况下，样本均值服从t分布，从而得到?x 的一个95%的置信区间： 10.63≦ ?x ≦12.36 （近似值）置信区间提供了在某一置信度下（如95%）真实的?x 的取值范围。因此，如果这个区间不包括零假设中的值，如?x =13，则拒绝零假设，即我们以95%的置信度拒绝零假设。反之，接受零假设。接受区域：上述不等式所描述的置信区间称为接受区域。零假设的临界区域（或拒绝区域）：接受区域以外的称为零假设的临界区域或拒绝区域。临界值：接受区域的上界和下界称为临界值。它们是接受或拒绝零假设的分界线。归纳：如果参数值在零假设下位于接受区域内，则不拒绝零假设，若落在接受区域以外（即落在拒绝区域内），则拒绝零假设。 10.63 12.36 P/E值 P/E总体均值的95%的置信区间 10.63 12.36 P/E值 P/E总体均值的95%的置信区间 13 2.5% 95% 2.5% 4.2 第一类错误和第二类错误 H0：?x =13 第一类错误：亦称弃真错误。在上述P/E例子中，我们以95%的置信度拒绝了零假设： ?x =13，那么是否就意味着上表中所给出的样本就不是来自均值为13的正态总体呢？或许事实的确如此。但是由于不等式给出的置信区间的置信度是95%，而非100%，故?x 有2.5%的可能性取值为13。如果真是这样，则拒绝H0： ?x =13，就可能犯错误，这种情况下，我们说犯了第一类错误（也称弃真错误）。 10.63 12.36 P/E值 P/E总体均值的95%的置信区间 12 2.5% 95% 2.5% H0：?x =12 第二类错误：亦称取伪错误。在上述例子中，假定零假设H0: ?x =12，在这种情况下，根据上述置信区间，我们应该不拒绝零假设。但是上表中的数据很可能不是来自均值为12的正态总体，此时我们会犯第二类错误，也即取伪错误。在研究中，我们想尽可能减小这两种错误。但是，对于任一给定的样本，我们不可能同时做到犯这两种错误的概率都很小。其解决方法为：先固定犯第一类错误的概率在一很低水平上，再考虑如何减小犯第二类错误的