- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计假设检验的概念和思想方法 引 言前一章中我们讨论了如何根据样本去得到总体分布中所含参数的 最优(优良)估计。用参数估计方法得到的总体参数的优良估计值,去代替总体分 布的未知参数而得到的“总体”,与真的总体作比较,就要考察它们 之间是否在统计意义上相拟合,尽管这种比较也只能在样本的基础 上进行。那么,怎样在样本的基础上做出一个有较大把握的结论, 就是统计假设检验问题。事实上,实际中很多统计问题都可以作为 统计假设检验问题予以解决。 在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。 第一个统计假设:。称为原假设,用符号:表示。, 表示 “采用新工艺后,灯管寿命没有显著提高。”即“和老产品一样,服从均值为1500的正态分布”。 第二个统计假设:。称为备选假设,用符号:表示。, 表示“采用新工艺后,灯管寿命有显著提高。”即“不同于老产品,服从均值大于1500的正态分布”。今后,我们把任意一个有关总体分布不确定的假设称为统计假设或简称假设。 至于在两个假设中用哪个作为原假设,哪个作为备选假设呢要看具体的目的和要求而定。(1)一般,假如我们的目的是希望从样本观测值对某一陈述取得强有力的支持,我们就将这一陈述的否定作为原假设,而把陈述本身作为备选假设。对例1我们作的统计假设就是这样的。因为,新工艺是延长灯泡寿命的一种革新,我们当然希望新工艺能使灯泡的寿命确有提高,但它又不象老产品那样有较多的数据。为此,我们以“即寿命没有提高”作为原假设,以“寿命显著提高”作为备选假设。(2)有时,原假设的选定还要考虑数学上的处理方便。在许多问题中,总体分布的类型为已知,仅仅是其分布函数中的一个或几个参数为未知,只要对这一个或几个参数的值作出假设,就可以完全确定总体的分布。如上例只要对作出假设即可。这种仅涉及到总体分布的未知参数的统计假设 称为:参数假设。在有些实际问题中,我们不知道总体分布的具体类型。比如:某种蔬菜的农药残留量,它可能服从对数正态分布,也可能服从其它分布。因此,对它的统计假设就只能对未知分布的类型或它的某些特征提出某种假设。这种不同于参数假设的统计假设称为:非参数假设。 例如:设某种蔬菜的农药残留量X 的分布函数为 F(x),F(x){对数正态分布族} ;F(x){ 正态分布族}都是 非参数假设。 从上面我们看到,一个统计假设是对总体分布状态的一种陈述。如果一个统计假设可完全确定总体的分布,则称这种假设为:简单统计假设 或 简单假设。否则,称为:复合统计假设 或 简称 复合假设。 例如 :完全确定总体的分布,是简单假设;而 :是复合假设。 统计假设检验问题 的 一般提法是:在给定备选假设下,对原假设作出判断。若拒绝原假设,那就意味着接受备选假设; 否则,就接受原假设。简单地说,统计假设检验问题,就是要在原假设备选假设中作出拒绝哪一个接受哪一个的判断。这类假设检验问题常称为对的检验问题。 二 、假设检验的思想方法 在对的检验问题中,要作出某种判断,必须从样本出发,制定出一个“法则”,一旦样本观测值确定后,我们就可以用所构造的“法则”作出:拒绝,还是拒绝的判断。? 那么我们的检验“法则”是什么呢? 它应该是以定义在样本空间 上的一个样本函数为依据所构成的一个“准则”。一旦样本观测值确定后,我们就可以根据这个“准则”作出:“拒绝”,还是“拒绝的”判断。 反之, 一旦我们给出了某个检验“准则”,也就给出了样本空间的一个“划分”。 由于样本的随机性,在进行判断时,我们还是有可能犯 两类错误: 第一类(弃真、拒真)错误发生的概率称为犯第一类错误的概率 或 拒真概率。通常记为,即: P( 拒绝|为真 )= 第二类(受假、受伪)错误发生的概率称为犯第二类错误的概率 或 受伪概率。通常记为,即: P( 接受|为假 )=。也就是:P( 拒绝|为真 )=下面我们来讨论,对给定的犯第一类错误的概率 (显著性水平) 在显著性假设检验问题中,如何来构造一个检验“法则”?如果一个检验法则已经确定,那么临界域 及其补集 就完全确定了。在实践中为了能简化数据,总是去寻找这样一个统计量或样本函数, 并记 及 于是 P(为真 )= P(|为真 )= 这样就可以做出等价的判断:当时,就拒绝;否则,就接受。 如此,就把对样本空间的划分问题转化为对统计量的值域空间的划分问题。由于样本空间是 n 维的,而统计量的值域空间是 1 维 的,所以通过构造合适的统计量可以使寻找临界域的问题变得简单多了。值得注意的是,如果我们构造的统计量 t 的分布类型已知,只是它的分布参数不确定,那么在原假设成立的条件下,对给定的显著水平 a , 可以通过等式 P (
文档评论(0)