基于一些研究者对p值内涵及其理解误区的思考.docxVIP

下载本文档

17
0
约3.04千字
约 4页
2021-08-11 发布于广东
举报
版权申诉

基于一些研究者对p值内涵及其理解误区的思考.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于一些研究者对p值内涵及其理解误区的思考摘要：基于一些研究者对统计假设检验P值的基本含义、概念及科学规范的使用方法了解有限，同时为了促进实证研究的规范化，针对假设检验决策中对P值错误解读及使用这一常见问题，对P值内涵及其理解误区进行深入剖析，并结合实例给予直观说明，以期进一步规范P值在假设检验中的运用。一、引言毋庸置疑，P值让很多研究者感到困惑。关于P值的内涵和怎样合理运用它解决实际问题，数据科学家Admond Lee花费了比较长的时间，才对其有了真正深刻的理解，有些学者甚至提出要摈弃P值的极端观点二、基本概念解析（一）P值定义当原假设（零假设）为真时，所得到的样本观察结果或更极端结果出现的概率，称为P值（P-value），也称为观察到的显著性水平（observed significance level）。如果P值很小，说明这种情况发生的概率很小，而如果出现了，根据小概率原理，就有理由拒绝原假设以标准正态分布为例给出P值的计算方法如下：检验统计量的样本观测值记为ZP值的一个通俗理解是，在原假设为真的条件下，在具体的样本统计量观测值和对应的总体参数假设值之间的差异中，由抽样随机误差引起的可能性大小。P值越小，拒绝原假设的理由就越充分，然而一个十分小的P值不能推断出原假设和备择假设哪一个是错误的。这是由于P值非常小可能是因为原假设不正确导致的，也可能只是由于违背研究设计形成的，抑或是由于研究人员选取的样本容量比较大引起的。较大的P值意味着在原假设成立前提下，样本数据的出现并非是罕见情况，但是并不意味着原假设是对的。也许是因为出现了违背研究设计的情形，或者是由于研究人员选取的样本容量比较小造成的。（三）P值和经典临界值差异P值是取值在（0,1]范围的一个数值，归根结底是一个概率。临界值是由事先给定的显著性水平α查相应分布表得到的数值。研究者对于P值非此即彼的观点削弱了其意义：如果P值α，则称为“统计上是显著的”，否则就被认为“统计上不显著”。由于临界值是基于显著性水平查表得到的数值，而显著性水平α通常情况又是事先给定的（若没有规定α数值，通常选取α=0.05），所以临界值是不随抽样数据变化而变化的；P值是基于样本数据，因而是计算之前无法获取的分析结果，故P值被称为实际观测到的显著性水平。P值检验是计算机时代通行的检验方式，无须按照不同的显著性水平查相关分布表来确定临界值。目前，一般的数据分析软件，在推断参数的同时都会给出相对应的P值。因此，在计算机时代P值检验更加方便可行。三、常见问题总结剖析（一）P值很小拒绝原假设时，检验结果一定有实际意义某个结论在统计上是显著的，但是不一定有实际价值。由于P值和抽样的样本容量n紧密相关，检验统计量的值会随着样本容量的增大而增大，而此时P值却越来越小，就越容易拒绝原假设。事实上，只要主观上想拒绝原假设就一定能拒绝它，只要无限增加样本容量，几乎总是可以拒绝原假设，这就是“欲加之罪，何患无辞”。因此，研究者为了研究结果可以发表或者使结果具有统计显著性可以人为选择一些数据和方法，基于此，不应过于关注P值的统计学意义。如果研究总体规模比较小，噪声也会把一个极其大的效应量淹没，在这种情形下难以利用统计假设检验得到统计显著性。（二）P≤α表示原假设为假或应拒绝原假设P值越小，意味着包括原假设在内的所有假设均为真的前提下，现有样本数据出现的可能性是越小的；但P值较小也可能是由于抽样不具有代表性或者统计推断过程中违反了除原假设以外的其他假设。（三）P值是原假设为真的可能性也就是说，假如在原假设为真的条件下，根据样本数据计算得到P=0.02，那么原假设为真的概率只有2%；如P=0.30，原假设为真的概率则有30%。P值是在原验假设为真的条件下计算得到的，它只反映现有样本数据与在包括原假设在内的所有假设成立的前提下预测情况的一致程度。所以，P=0.02意味着样本数据和根据模型预测的情况不是很接近，P=0.30相比之下暗示样本数据和模型分析预测情况相对来说更为相近。P值并不能体现某一理论是否存在的概率，只是表示在其不正确的前提下，现有样本数据以及有可能获取但是没得到的更加极端数据出现的可能性。（四）P值表明的是所观测到的一致程度是只因偶然因素产生的可能性例如，若在原假设成立条件下，得出P值为0.08，则说明有8%的机率是来自偶然引起的关联。此思想的不尽合理之处在于：以为只由偶然因素造成了现有观测结果，也就意味着在逻辑上承认包含原假设在内的所有用来计算P值的假设均是对的。P值较大只表明，包括原假设在内的所有假设均成立时，出现现有样本数据的可能性不是小概率。并不表示零假设是对的，零假设错误的可能性仍是非常大的，只能说还没有找