- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关系数与P值的一些基本概念.
相关系数与P值的一些基本概念
注:在期末论文写作过程中,关于相关系数与假设检验结果的表达方式,出现了一些概念问题。这篇文档的内容是对一些相关资料进行整理后的结果,供感兴趣的同学参考。如果需要更确切的定义,请进一步参阅统计分析类的教材。
相关系数
常用Pearson’s correlation coefficient,计算公式与传统概念上的相同,即:
常用符号r表示。-1≤r≤1
如果用于评估数据点与拟合曲线间的关联程度,则一般用相关系数的平方值表示,常用符号为,
典型示例如下图。相差不大,但显然数据规律完全不同。因此,一般需要结合拟合曲线图表给出,才有参考价值。
相关系数另一方面的应用是用来评估两组数据之间相互关联的程度,简单来说,就是判断一下两参量之间是否“相关”,有3种可能的情况,如下面的图所示。
r0,正相关。x增大,y倾向于增大;
r0,负相关。x增大,y倾向于减小;
r=0,不相关。x增大,y变化无倾向性;
此时的相关系数一般用r表示。下图给出了不同r取值的例子。
显然,如果只是用来判断两参量之间的“关联”性质,r=-0.70与r=0.70应该是相同的。所以也可用(常见)r的绝对值表达。用文字表述“关联”程度时,可参考下面的取值范围建议:
需要注意的是,这种相关系数的计算方法给出的r值,实际上反映的是“线性相关”的程度,如果两者虽然相关,但不是线性的,很可能给出不是很靠得住的结果,观察下面的例子。
左下角图中,两参量显然相关,但“线性”程度不够,所以Pearson’s correlation coefficient只有0.88。
另外一种相关系数的计算方法,Spearman correlation coefficient,用来评估两参量之间的“单调相关性”。如上面左下角图中的Spearman相关系数=1。Spearman correlation coefficient计算公式为:
其中,n为样本数,
下面的图是一些例子:
2. P值(p-values)
P值是配对t检验(paired t-test)计算过程中得到的结果。用来评估前面所述相关程度计算结果的“显著程度”。在常用统计软件SPSS中,P值(p-value,有时显示为Sig-value)的计算是建立在如下两个假设基础上的:
无效假设(null hypothesis),两参量间不存在“线性”关联。
备择假设(alternative hypothesis),两参量间存在“线性”关联。
如果计算出的P值很小,比如为0.001,则可说“有非常显著的证据拒绝H0假设,相信H1假设,即两参量间存在显著的线性关联”。
P值的数值大小没有统计意义,只是将其与某一个阈值进行比对,以得到二选一的结论。关于P值的判断阈值,可参照下面给出的建议:
典型的阈值取为0.05(5%)。因此判断规则如下:
P≤0.05,拒绝无效假设,接受备择假设,即“存在显著的线性关联”;
P0.05,拒绝无效假设失败。
注意:
上面所给出的判断方式中,确切的结论是以“p≤阈值”为标准的,如果不是这样,而是“p阈值”,则只能给出检验失败的结论,不能说“接受无效假设”,从而得出“存在显著线性关联”的结论。
P值只用于二值化判断,因此不能说P值=0.06比0.07“更好”。
为更好地理解,下面给出例子。
两参量Hb、PCV,经SPSS软件计算得到如下结果:
结论可表达为;“对于所采集到的14个样本值,计算了两参量Hb、PCV之间的Pearson相关系数,两参量之间存在显著正相关(r=0.88, N=14, p0.001)”。
需要注意的是,相关程度未必能够代表两参量之间存在因果关系。比如上面的例子,只能说明Hb、PCV之间存在关联,而不是“Hb导致PCV变化”。
这种统计分析的结论,与具体的实验设计方式关系很大,需要特别关注是否存在一些隐藏在数据背后的因素。下面是一个极端一些的例子,分析儿童足底长度(footlength)与阅读能力(reading ability) 之间的关系。
用SPSS计算,可得到足底长度与阅读能力之间“显著相关”的结果(r=0.88,N=54,p=0.003)。然而,如果考虑到年龄,则可发现这种“显著相关”很可能是靠不住的,如下图。
下面的图是分年龄的统计结果。可以看到,无法得到“显著相关”的结论。
您可能关注的文档
- 电机与拖动练习题..doc
- 电机四象限运行..docx
- 电机大作业(MATLAB仿真,电机特性曲线)..doc
- 电机学A卷..doc
- 电机学_徐明义_教学计划..doc
- 电机学下复习资料..docx
- 电机学期末复习总结..doc
- 电机学概念以及公式总结..doc
- 电机检修-绘图题..doc
- 电机转动惯量匹配..doc
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
文档评论(0)