北京大学统计学经典课件第三章——统计推断.ppt

下载文档

1
0
约3.22千字
约 19页
2017-05-21 发布于北京
举报
版权申诉
保障服务

北京大学统计学经典课件第三章——统计推断.ppt

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

估计总体它代表我们所关心的那部分现实世界。而在利用样本中的信息来对总体进行推断之前人们一般对代表总体的变量假定了分布族。比如假定人们的身高属于正态分布族；对抽样调查假定了二项分布族等等。这些模型基本上是根据经验来假定的，所以仅仅是对现实世界的一个近似。在假定了总体分布族之后，进一步对总体的认识就是要在这个分布族中选择一个适合于我们问题的分布；由于分布族成员是由参数确定的，如果参数能够估计，对总体的具体分布就知道得差不多了。估计一种是点估计(point estimation)，也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计(interval estimation)；它是包括估计量在内（有时是以估计量为中心）的一个区间；该区间被认为很可能包含总体参数。点估计给出一个数字，用起来很方便；而区间估计给出一个区间，说起来留有余地；不象点估计那么绝对。无偏估计(大样本性质) 区间估计的置信度(大样本性质) 估计注意置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差（即置信区间），并不说明置信度，也不给出被调查的人数，这是不负责的表现。因为降低置信度可以使置信区间变窄（显得“精确”），有误导读者之嫌。如果给出被调查的人数，则内行可以由推算出置信度（由后面给出的公式），反之亦然。一个描述性例子一个有10000个人回答的调查显示，同意某种观点的人的比例为70%（有7000人同意），可以算出总体中同意该观点的比例的95%置信区间为（0.691，0.709）；另一个调查声称有70%的比例反对该种观点，还说总体中反对该观点的置信区间也是（0.691，0.709）。到底相信谁呢？实际上，第二个调查隐瞒了置信度（等价于隐瞒了样本量）。如果第二个调查仅仅调查了50个人，有35个人反对该观点。根据后面的公式可以算出，第二个调查的置信区间的置信度仅有11%。假设检验在假设检验中，一般要设立一个原假设；而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾，从而否定这个假设。在多数统计教科书中（除了理论探讨之外）的假设检验都是以否定原假设为目标。如果否定不了，那就说明证据不足，无法否定原假设。但这不能说明原假设正确。很多教科书在这个问题上不适当地用“接受原假设”的说法，犯了明显的低级逻辑错误。假设检验的过程和逻辑首先要提出一个原假设，比如某正态总体的均值等于5（m=5）。这种原假设也称为零假设（null hypothesis），记为H0。与此同时必须提出对立假设，比如总体均值大于5（m5）。对立假设又称为备选假设或备择假设（alternative hypothesis）记为记为H1或Ha。假设检验的过程和逻辑根据零假设（不是备选假设！），我们可以得到该检验统计量的分布；然后再看这个统计量的数据实现值（realization）属不属于小概率事件。也就是说把数据代入检验统计量，看其值是否落入零假设下的小概率范畴；如果的确是小概率事件，那么我们就有可能拒绝零假设，否则我们说没有足够证据拒绝零假设。假设检验的过程和逻辑注意：零假设和备选假设在假设检验中并不对称。因检验统计量的分布是从零假设导出的，因此，如果发生矛盾，当然就对零假设不利了。不发生矛盾也不说明备选假设有问题（因为和备选假设无关）。假设检验的过程和逻辑检验统计量在零假设下等于这个样本的数据实现值或更加极端值的概率称为p-值（p-value）。显然得到很小p-值意味着小概率事件发生了。如果小概率事件发生，是相信零假设，还是相信数据呢？当然是相信数据。于是就拒绝零假设。但小概率并不能说明不会发生，仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误（type I error）。假设检验的过程和逻辑有第一类错误，就有第二类错误；那是备选零假设正确时反而说零假设正确的错误，称为第二类错误（type II error）。零假设和备选假设哪一个正确，这是确定性的，没有概率可言。而可能犯错误的是人。涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。负责的态度是无论做出什么决策，都应该给出犯错误的概率。假设检验的过程和逻辑到底p-值是多小才能够拒绝零假设呢？也就是说，需要有什么是小概率的标准。这要看具体应用的需要。但在一般的统计书和软件中，使用最多的标准是在零假设下（或零假设正确时）抽样所得的数据拒绝零假设的概率应小于0.05（也可能是0.01，0.005，0.001等等）。这种事先规定的概率称为显著性水平(significant level)，用字母a来表示。当p-值小于或等于a时，就拒绝零假设。所以，a是所允许的