- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
穷则独善其身,达则兼善天下。——《孟子》
【数据分析】统计学中p值的含义和显著差异性分析-小马哥的
日志-网易博客
【数据分析】统计学中p值的含义和显著差异性分析
数据分析2025-03-0421:04:43阅读629评论0字号:大中小
这个社会是残酷的,刚来公司,很多的职业技能尚不具备,但还
是要硬着头皮答应经理“苛刻”的要求,无论实验的过程多么难,结
果的可预测性多么小,我都会回答“OK!这不是打脸充胖子,也不是
要面子,这就是职场,你不学习是不行的!即使有些东西你从来没有
遇到过,甚至没有听说过,你也要因为需要去理解它,掌握它!你比
别人掌握的多,你就会慢慢变得很牛气,就会变得有价值,变得不可
或缺!这就是职场最需要的!今天就学习一下P值的统计学意义!
(当我作出别人都很羡慕的图表时,我的心情是很愉悦的,同样地,
当我在对一组数据头头是道的分析时,从别人的眼神中,我读出了
“崇拜”)。
统计学意义(p值)(这是经理每次争论的焦点)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计
方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们
越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值
是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示
样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意
变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实
验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不
是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,
当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统
计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受
错误的边界水平。
如何判定结果具有真实的显著性
在最后结论中判断什么样的显著性水平具有统计学意义,不可避
免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选
以家为家,以乡为乡,以国为国,以天下为天下。——《管子》
择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过
程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据
集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。
通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义
的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果
0.05≥p0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具
有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判
断常规。
所有的检验统计都是正态分布的吗?
并不完全如此,但大多数检验都直接或间接与之有关,可以从正
态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要
求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多
观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特
征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变
量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。
这种条件下有两种方法:一是用替代的非参数检验(即无分布性检
验),但这种方法不方便,因为从它所提供的结论形式看,这种方法
统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况
下,通常还是可以使用基于正态分布前提下的检验。后
文档评论(0)