网站大量收购独家精品文档,联系QQ:2885784924

统计分析P值的含义.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
P 值是最常用的一个统计学指标,几乎统计软件输出结果都有 P 值。了解p 值的由来、计算和意义很有必 要。 统计学意义(p 值)(这是经理每次争论的焦点) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上, p 值为结果可信程度的一个递减指标,p 值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。 p 值是将观察结果认为有效即具有总体代表性的犯错概率。如 p=提示样本中变量关联有 5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约 20 个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到 5%或 95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域, 的 p 值通常被认为是可接受错误的边界水平。 如何判定结果具有真实的显著性 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无 效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先 验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究 领域的惯例。通常,许多的科学领域中产生 p 值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果 ≥p被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义 。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗? 并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如 t 检验、f 检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法: 一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。 1 统计软件的选择 在进行统计分析时,作者常使用非专门的数理统计软件 Excel 进行统计分析。由于 Excel 提 供的统计分析功能十分有限,很难满足实际需要。目前,国际上已开发出的专门用于统计分析的商业软件很多, 比较著名有 SPSS(Statistical Package for Social Sciences) 、SAS(Statistical Analysis System) 、BMDP 和 STATISTICA 等。其中,SPSS 是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP 是专门为生物学和医学领域研究者编制的统计软件。目前,国际学术界有一条不成文的约定: 凡是用 SPSS 和 SAS 软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。由此可见, SPSS 和 SAS 软件已被各领域研究者普遍认可。建议作者们在进行统计分析时尽量使用这 2 个专门的统计软件。 均值的计算 在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。此时,多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的。在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等。何时用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定, 而要根据随机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其总体的数学期望就是其算术平均值。此时,可用样本的算术平均值描述随机变量的大小特征。 如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则可用几何平均值描述该随机变量总体的大小。此时,就可以计算变量的几何平均值。如果随机变量既不服从正态分布也不服从对数正态分布, 则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。退而求其次,此时可用中位

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档