网站大量收购闲置独家精品文档,联系QQ:2885784924
  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章:非

7.0 非参数统计简介 非参数检验与参数检验共同构成统计推断的基本内容 参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。 非参数检验是在总体分布未知或知道很少的情况下,利用样本数据对总体分布形态进行推断的方法。由于非参数检验方法在统计推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。 参数统计还是非参数统计?(1) 在选择参数方法还是非参数方法时,一个需要考虑的因素是产生数据的测量尺度。所有的数据都由以下四种测量尺度之一产生: 1. 名义尺度:如果数据是用来确认个体属性的标签或类别,则其测量尺度是名义的(数值型或非数值型)。 2.顺序尺度:如果数据用于对观测值进行排秩或者排序,则其测量尺度是顺序的(数值型或非数值型)。 3.间隔尺度:如果数据具有顺序数据的性能,并且可以用一个固定度量单位来表示观测值之间的间隔,则其测量尺度是间隔的(数值型)。 4.比率尺度:如果数据具有间隔数据的性能,而且测量值之比是有意义的,则其测度测度是比率的(数值型)。 参数统计还是非参数统计?(2) 绝大多数的参数统计方法要求使用间隔或比率尺度的数据。这些计量水平上进行数学运算是有意义的,而且均值、方差、标准差等是可以计算、解释并用于分析的。对于名义或顺序数据,计算均值、方差和标准差是不恰当的,因此,通常情况下不能使用参数方法。非参数方法常用来分析这些数据并得出统计结论的唯一途径。总的说来,一种统计方法被归类为非参数统计方法,它至少应该满足下列条件之一: (1) 这种方法可以用于名义数据和顺序数据。 (2)当无法对总体概率分布做出假设时,这种方法可用于间隔或比率数据。 非参数检验的优点 它对总体分布一般不作过多的限制性假设; 由于非参数方法不依赖于总体的分布形式,因而它天然具有稳健性特征; 对资料的测量水平要求不高,这给资料的搜集带来了很大的方便,可以大大减轻统计资料搜集工作量。同时,也为定性资料研究提供了广泛的基础; 非参数统计的方法比较直观,很容易理解,不需要太多的数学知识和统计理论; 多数非参数方法的运算比较简单,可以较快地取得统计结果。 非参数检验的原理 非参数检验过程也是先根据问题提出原假设,然后利用统计学原理构造出适当的统计量,最后利用样本数据计算统计量的概率p值,与显著性水平进行比较,得出拒绝或者接受原假设的结果。 7.1 单样本的非参数检验 得到一批样本数据后,希望了解样本来自的总体的分布是否与某个已知的理论分布相吻合。一方面,可以通过绘制直方图、P-P图、Q-Q图等方法作粗略判断,另一方面,还可以利用非参数检验的方法实现。 SPSS单样本非参数检验是通过对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K—S检验以及变量值随机性检验等方法。 7.1.1 总体分布的卡方检验 (1) 基本概念 卡方检验(Chi-Square Test)法,也称卡方拟合优度检验,它是K.Pearson给出的一种最常用的非参数检验方法,用于检验样本数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。卡方检验方法,是一种吻合性检验,通常适用于对有多项分类值的总体分布的分析。 (2) 统计原理 如果从一个随机变量X中随机抽取若干个观察样本,这些样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷大时近似服从卡方分布。基于这一思想,对变量X总体分布的检验就可以从对各个观察频数的分析入手。 在原假设成立的条件下,如果变量值落在第i子集中的理论概率值为pi,于是相应的期望频数便为npi 。由此计算出的期望频数分布代表了原假设成立时的理论分布。为检验实际分布是否与理论分布(期望分布)一致,可采用卡方检验统计量。典型的卡方统计量是Pearson卡方,其数学定义为: 其中, K:子集个数 fi0:观察频数 fie:期望频数 x2:服从k-1个自由度的卡方分布 如果x2值较大,则说明观察频数分布与期望频数分布差距较大;反之,如果x2值较小,则说明观察频数分布与期望分布较近。SPSS将自动计算x2统计量的观测值,并依据卡方分布表计算观测值对应的概率p-值。

文档评论(0)

ranfand + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档