- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                基于一些研究者对p值内涵及其理解误区的思考
摘要:基于一些研究者对统计假设检验P值的基本含义、概念及科学规范的使用方法了解有限,同时为了促进实证研究的规范化,针对假设检验决策中对P值错误解读及使用这一常见问题,对P值内涵及其理解误区进行深入剖析,并结合实例给予直观说明,以期进一步规范P值在假设检验中的运用。
一、引言毋庸置疑,P值让很多研究者感到困惑。关于P值的内涵和怎样合理运用它解决实际问题,数据科学家Admond Lee花费了比较长的时间,才对其有了真正深刻的理解,有些学者甚至提出要摈弃P值的极端观点二、基本概念解析(一)P值定义当原假设(零假设)为真时,所得到的样本观察结果或更极端结果出现的概率,称为P值(P-value),也称为观察到的显著性水平(observed significance level)。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,就有理由拒绝原假设以标准正态分布为例给出P值的计算方法如下:检验统计量的样本观测值记为ZP值的一个通俗理解是,在原假设为真的条件下,在具体的样本统计量观测值和对应的总体参数假设值之间的差异中,由抽样随机误差引起的可能性大小。P值越小,拒绝原假设的理由就越充分,然而一个十分小的P值不能推断出原假设和备择假设哪一个是错误的。这是由于P值非常小可能是因为原假设不正确导致的,也可能只是由于违背研究设计形成的,抑或是由于研究人员选取的样本容量比较大引起的。较大的P值意味着在原假设成立前提下,样本数据的出现并非是罕见情况,但是并不意味着原假设是对的。也许是因为出现了违背研究设计的情形,或者是由于研究人员选取的样本容量比较小造成的。(三)P值和经典临界值差异P值是取值在(0,1]范围的一个数值,归根结底是一个概率。临界值是由事先给定的显著性水平α查相应分布表得到的数值。研究者对于P值非此即彼的观点削弱了其意义:如果P值α,则称为“统计上是显著的”,否则就被认为“统计上不显著”。由于临界值是基于显著性水平查表得到的数值,而显著性水平α通常情况又是事先给定的(若没有规定α数值,通常选取α=0.05),所以临界值是不随抽样数据变化而变化的;P值是基于样本数据,因而是计算之前无法获取的分析结果,故P值被称为实际观测到的显著性水平。P值检验是计算机时代通行的检验方式,无须按照不同的显著性水平查相关分布表来确定临界值。目前,一般的数据分析软件,在推断参数的同时都会给出相对应的P值。因此,在计算机时代P值检验更加方便可行。三、常见问题总结剖析(一)P值很小拒绝原假设时,检验结果一定有实际意义某个结论在统计上是显著的,但是不一定有实际价值。由于P值和抽样的样本容量n紧密相关,检验统计量的值会随着样本容量的增大而增大,而此时P值却越来越小,就越容易拒绝原假设。事实上,只要主观上想拒绝原假设就一定能拒绝它,只要无限增加样本容量,几乎总是可以拒绝原假设,这就是“欲加之罪,何患无辞”。因此,研究者为了研究结果可以发表或者使结果具有统计显著性可以人为选择一些数据和方法,基于此,不应过于关注P值的统计学意义。如果研究总体规模比较小,噪声也会把一个极其大的效应量淹没,在这种情形下难以利用统计假设检验得到统计显著性。(二)P≤α表示原假设为假或应拒绝原假设P值越小,意味着包括原假设在内的所有假设均为真的前提下,现有样本数据出现的可能性是越小的;但P值较小也可能是由于抽样不具有代表性或者统计推断过程中违反了除原假设以外的其他假设。(三)P值是原假设为真的可能性也就是说,假如在原假设为真的条件下,根据样本数据计算得到P=0.02,那么原假设为真的概率只有2%;如P=0.30,原假设为真的概率则有30%。P值是在原验假设为真的条件下计算得到的,它只反映现有样本数据与在包括原假设在内的所有假设成立的前提下预测情况的一致程度。所以,P=0.02意味着样本数据和根据模型预测的情况不是很接近,P=0.30相比之下暗示样本数据和模型分析预测情况相对来说更为相近。P值并不能体现某一理论是否存在的概率,只是表示在其不正确的前提下,现有样本数据以及有可能获取但是没得到的更加极端数据出现的可能性。(四)P值表明的是所观测到的一致程度是只因偶然因素产生的可能性例如,若在原假设成立条件下,得出P值为0.08,则说明有8%的机率是来自偶然引起的关联。此思想的不尽合理之处在于:以为只由偶然因素造成了现有观测结果,也就意味着在逻辑上承认包含原假设在内的所有用来计算P值的假设均是对的。P值较大只表明,包括原假设在内的所有假设均成立时,出现现有样本数据的可能性不是小概率。并不表示零假设是对的,零假设错误的可能性仍是非常大的,只能说还没有找
                您可能关注的文档
- 基于coha的英语时空表征研究.docx
- 基于colaizzi7步分析法的脑卒中后吞咽障碍食物评估与体会.docx
- 基于cole-cole参数的自适应免疫-最小一乘算法.docx
- 基于column的环仿真平台在环仿真中应用研究.docx
- 基于covid-19的临床研究进展.docx
- 基于cpcc的运载货车质量估计.docx
- 基于cryosa-2卫星的南极参考高程模型.docx
- 基于cs架构的自主学习中心系统设计研究.docx
- 基于d-ahp的电网灾变恢复智慧预案评估.docx
- 基于dcc-garch模型的中国金融市场与中国金融市场间风险传染效应.docx
- 基于仪器设备档案管理的健康防疫工作探究.docx
- 基于以岗位需求为职业教育出发点的中职护理专业英语教学改革研究.docx
- 基于以学为中心的高职院校大学英语教学中以学为中心调查研究.docx
- 基于亦生亦师模式的初中数学教学探究.docx
- 基于云的博物馆线上服务发展研究.docx
- 基于云计算的传染病症候群与病原学监测数据分析平台设计与实现.docx
- 基于云平台的大学英语写作课程翻转课堂在慕课教学中的实现.docx
- 基于云平台的五维一体大学英语线上智慧教育模式探讨.docx
- 基于中尺度气象模式的国际耦合模式下国内外对中尺度气候变化预估研究.docx
- 基于中国co-op的co-op模型实现对北京城市空气质量的分析.docx
最近下载
- 轴类零件图纸.doc VIP
- 曲臂车高空作业施工方案.docx VIP
- 外研版英语(三起点)六年级上册 Module4 大单元学历案教案 教学设计附作业设计(基于新课标教学评一体化).docx VIP
- 2025年六安社区考试试题及答案.doc VIP
- T_CSBZ 004-2024 石材护理技术规范.docx VIP
- 学校建设项目施工全流程指南.docx VIP
- 《航空动力装置》模拟试卷A..doc VIP
- 2026年鄂尔多斯职业学院单招综合素质考试题库必考题.docx VIP
- 第五单元习作:生活万花筒(范文点评)-2023-2024学年四年级语文上册单元作文能力提升(统编版).docx VIP
- JIS B2220-2004 英文版 钢制管法兰(日文).doc VIP
 原创力文档
原创力文档 
                        

文档评论(0)