- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
剖析假设检验的两类错误并举例说明
组长:胡立文
PPT制作:吴思远
演讲人:胡立文
组员:胡立文、吴思远、林君豪、白鲁宁、殷妃、陈芷琳
在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误
第一类错误—弃真错误
即H0本来正确,却拒绝了它,犯这类错误的概率不超过α,即P{拒绝H0/H0为真}≤α
可能产生的原因:1.样本中极端数值
2.采用决策标准较宽松
第二类错误—取伪错误
即H0本不真,却接受了他,犯这类错误的概率记为β,即P{接受H0/H1为真}=β
可能产生原因:1:实验设计不灵敏
2.样本数据变异性过大
3.处理效应本身比较小
两类错误的关系
1:α与β是在两个前提下的概率,所以α+β不一定等于1
2:在其他条件不变的情况下,α与β不能同时增加或减少
案例说明
例子:一个公司有员工3000 人(研究的总体) ,为了检验公司员工工资统计报表的真实性,研究者作了 50 人的大样本随机抽样调查,人均收入的调查结果是: X (样本均值)=871 元;S(标准差)=21 元 问能否认为统计报表中人均收入μ0=880 元的数据是真实的?(显著性水平α=0.05 )
研究假设
原假设 H0:调查数据 871 元与报表数据 880 元之间没有显著性差异,公司员工工资均值的真实情况为880 元; 假设 H1:调查数据和报表数据之间有显著性的差异,公司员工工资均值的真实情况不是880 元。
α 错误出现原因
我们只抽了一个样本,而个别的样本可能是特殊的,不管你的抽样多么符合科学抽样的要求。理论上讲,在 3000 个员工中随机抽取 50 人作为调查样本,有很多种构成样本的可能性,相当于 3000 选 50,这个数目是很大的。这样,在理论上就有存在很多个样本平均数。也就是说,由于小概率事件的出现,我们把本来真实的原假设拒绝了。这就是 α 错误出现的原因。
β 错误出现原因
第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。命题 B 是由命题 A 经演绎推论出来的,或写作符号 A→B,命题 C 是我们在检验中所依据操作法则。如果A 是真的,且我们从 A 到 B 的演绎推论如果也是正确的,那么B 可能是真实的。相反,如果结果 B是真实的,那么就不能得出A 必定是真实的结论。这就是 β错误出现的原因。
出现两类错误的概率计算
α 错误是由实际推断原理引起的,即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平(α=0.05)看作α错误发生的概率,换言之,α错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为 α/2。
β错误的概率的计算
犯β错误的概率的计算是比较复杂的,由于β错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。
我们在以上例子的基础上进一步设计:这个公司职员的实际工资不是880 元,而是是 870 元,原假设为伪,仍然假设实际工资是880元。这样我们就可以在总体均值为 870 元和 880元两种情况下, 分别作出两条正态分布曲线 (A线和 B 线) ,见下图。
犯 β错误的概率大小就是相对正态曲线A 而言,图 1 中阴影部分的面积:
ZX1=1.41 ;ZX2=5.59
查标准正态分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793
结果表明,如果总体的真值为 870 元,而虚无假设为880元的话,那么,平均而言每100 次抽样中,将约有8次把真实情况当作880 元被接受,即犯β错误的概率大小是0.0793。
对相关命题的说明
命题 1:在统计检验中,在样本容量一定的条件下,α 错误和 β 错误不可能同时减小。这个命题可以借助前面的图形1 来理解,一旦正态分布A 的拒绝域减小即 α 错误减小,则( 2 1 Χ − Χ )这个区域将增大,而图 A 上阴影部分的面积(β错误)也将增大。
命题 2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小, 犯β 错误的概率越大。 这个命题也可以从图形1 得到说明。 因为△μ越小,两个正态图就相距越近,阴影部分面积就增大。
命题 3:犯 α 错误的概率和犯 β 错误的概率之和不为 1。α 错误的概率是在图 A 上被指示的显著性水平的大小,而 β 错误的概率是图 A 上阴影部分的面积。既然假设的总体均值并不与真值相等(这是错β 误产生的前提) ,图 A 与图 B 就不可能重合,因此α 和之 β 和不可能为1。
两类错误的危害
犯第一类错误的危害较大,由于报告了本
文档评论(0)