p值检验与假设检验的比较.docxVIP

  • 11
  • 0
  • 约3.67千字
  • 约 3页
  • 2023-12-02 发布于广东
  • 举报
p值检验与假设检验的比较 一、 因错误发生的概率 错误检测的基本思想是概率法。为了验证原始值h0是否正确,首先,假设这个假设是正确的,并看看下面是否可以实现。如果导致一个不合理的结果, 则表明“假设H0为正确quot;是错误的, 即假设H0不正确, 因此要拒绝原假设H0;如果没有导致一个不合理现象的出现, 则不能认为原假设H0不正确, 因此不能拒绝原假设H0。 在假设检验中, 由于随机性我们可能在决策上犯两类错误, 一类是假设正确, 但我们拒绝了假设, 这类错误是“弃真quot;错误, 被称为第一类错误;一类是假设不正确, 但我们没拒绝假设, 这类错误是“取伪quot;错误, 被称为第二类错误。一般来说, 在样本确定的情况下, 任何决策无法同时避免两类错误的发生, 即在避免第一类错误发生机率的同时, 会增大第二类错误发生的机率;或者在避免第二类错误发生机率的同时, 会增大第一类错误发生的机率。人们往往根据需要选择对哪类错误进行控制, 以减少发生这类错误的机率。大多数情况下, 人们会控制第一类错误发生的概率。进行假设检验时, 是通过事先给定显著性水平a的值来控制第一类错误发生的概率。这个发生第一类错误的概率被称作显著性水平, 一般用a表示。a通常都固定在1%、5%及10%的水平上。 假设检验方法的不足之处就是选择a的任意性, 虽然一般常用的a值有1%、5%和10%, 但是这些并不是固定不变的。另外, 由于检验是利用事先给定显著性水平的方法来控制犯错误概率的, 所以对于两个数据比较相近的假设检验, 我们无法知道哪一个假设更容易犯错误, 即我们通过这种方法只能知道根据这次抽样而犯第一类错误的最大概率, 而无法知道具体在多大概率水平上犯错误。计算P值有效的解决了这个问题, P值 (p value) 即概率值, 它也成为统计量精确置信水平 (精确概率) , 或者说, 拒绝零假设的最低置信水平, P值越低拒绝零假设的证据越充分。换句话说, 只有在P值这个显著性水平下我们才能够拒绝零假设。 二、 模型1:个人特质不符合情况下的质量不良反应 P值其实就是按照抽样分布计算的一个概率值, 这个值是根据检验统计量计算出来的。通过直接比较P值与给定的显著性水平a的大小就可以知道是否拒绝假设, 显然这就代替了比较检验统计量的值与临界值的大小的方法。而且通过这种方法, 我们还可以知道在P值小于a的情况下犯第一类错误的实际概率是多少, P=0.03a=0.05, 那么拒绝假设, 这一决策可能犯错误的概率是0.03。需要指出的是, 如果Pa, 那么假设不被拒绝, 在这种情况下, 第一类错误并不会发生。 T检验中的P值是接受两均值存在差异这个假设可能犯错误的概率。例如:如果零假设是两个总体的均值相等 (u1=u2) , 但是从相应的两个样本中所计算出的样本的均值不相等, 有一定的“差异quot;。如果根据这个“差异quot;值计算出p0.01, 那么就是说, 如果零假设是正确的, 即两个总体的均值相等, 那么在样本的均值之间产生了像本例中这样大的差异的概率小于0.01。也就是说, 产生像这两个样本均值这样大的差异的原因是随机发生的, 而不是由于它们所来自的总体本来的均值就不相等, 出现这种差异结果的概率是0.01。 三、 样本均值的回归 我们用一个例子来说明假设检验和P值检验。如果一公司其听装咖啡标签标明:听内至少装有3磅的咖啡。假定我们用假设检验来验证标签的陈述是否正确。建立原假设与备择假设, 我们假定标签所说是正确的。总体的平均重量每听大于或等于3磅。H0∶均值 (a) 大于或等于3;H1∶均值 (a) 小于3。如果样本数据说明原假设H0不能被拒绝, 不需要对该公司采取处罚行动;如果样本数据说明H0被拒绝了, 那么我们接受H1, 认为听内咖啡未装满的结论成立。 假定抽取36听咖啡作为样本, 如果其平均重量不到3磅, 那么样本结果就将开始怀疑原假设是否正确。但是, 究竟平均重量低于3磅到什么程度, 我们才愿意冒犯第一类错误的风险, 错误地控告该公司违背了标签的陈述呢?我们不可能一旦样本均值小于3就直接认为该公司违背标签陈述, 因为我们是从样本检验总体, 小概率事件也是会发生的, 直接认为就易犯弃真错误。 我们首先假定原假设H0为真。若样本容量大于3, 样本均值 (b) 的抽样分布就可以近似看成正态概率分布。z= (样本均值-3) /样本方差, 给出了样本均值 (b) 偏离总体均值 (a=3) 的标准差的数目。对于总体均值 (a) 的假设检验, 我们用检验统计量z来确定样本均值 (b) 偏离总体均值 (a=3) 到什么程度才刚好证明拒绝原假设是正确的。注意:z=-1的意思是样本均值 (b) 低于总体均值 (a=3) 1个标准差;z=-2的意思是样本均值 (b

文档评论(0)

1亿VIP精品文档

相关文档