- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非参数检验
非参数检验,又称为分布检验,与前面介绍的t、F检验的着眼点不同,它并不对总体的参数进行检验,而是研究目标总体的分布情况是否与理论相同,或分布位置及形状是否相同。常见的非参数检验如卡方检验、秩和检验、二项分布检验、游程检验等。
本讲内容主要分为两个部分:分布检验(即所谓的拟合优度检验,包括Chi-square、Binomial、Runs、1-Sample K-S命令)与位置检验(2 Independent Samples、K Independent Samples、2 Related Samples、K Related Samples命令)。
一、分布检验
Chi-Square:
请注意,这里所指的Chi-square不是教科书上的卡方检验(课本中的卡方检验使用的是Crosstabs命令),准确的说应该称为卡方拟合优度检验。其检验目的在于分析分类数据的频数分布是否满足特定的概率分布。例如:一颗骰子投掷300次,各点出现的频数结果见骰子.sav,问该骰子是否是六面均匀的。我们假设骰子是均匀的,则每一个面出现的理论频数均为50次,但是由于抽样误差所以300次投掷所组成的一个样本中并非每个面出现的频率均为50次,如果假设成立的话,实际频数与理论频数的差距应该不大,这就需要用到拟合优度检验。
由于提供的数据已经是经过整理后的频数表数据,所以分析时要对点出现的频数加权:
上图为Chi-square的主对话框,讲点数选入test variable list中,expected range为设定检验变量的取值范围,默认是所有变量值都进入分析;Expected values为理论值,默认情况下认为每个类别是均匀分布的;对于本例由于所有变量取值都进入分析,而且假设每个面出现的概率均相同,所以不必对上述界面作变动。接着点击Exact选择是否进行精确概率运算:
Asymptotic only为计算近似概率:它使用Pearson ??计算公式(??E)??计算机随机模拟方法产生大量随机样本,然后对这些样本结果进行概率分析,从而来预测结果的方法
选择好计算概率的方法后,可以对Options作设定;Statistics中的选项主要针对正态分布的拟合,在本例中可以不作设定;Missing values中的选项含义详见前述t检验。
设定结束后提交系统运行,结果如右上图:该表为数据描述表,列出实际频数、理论频数以及两者的差值。下表为最终的统计分析结果:卡方值为8.960,自由度为5,P值为0.111,所以可认为该骰子是均匀的。
*注意1:如果要检验连续型数据是否满足正态分布、均匀分布、泊松分布或指数分布可直接选用1-Sample K-S命令;如果要分析分类数据是否满足二项分布,可以直接调用Binomial过程。
注意2:如果想验证原始数据是否正态,则定量资料的影响最终结果,因此卡方拟合优度检验更适合分类变量的数据
Binomial:
该命令用于检验二分类变量值出现的情况是否满足二项分布。例如:掷一枚足球比赛用的挑边器共计50次,其中正面向上出现22次,向下出现28次,问该挑边器是否均匀?资料见硬币.sav。
点击weight cases,将频数设定为权重,而后点击Binomial,出现如下窗口:
将出现情况移入test variable list中,理论上(无效假设认为是均匀的)每个面出现的可能性为0.5,所以test proportion中为0.5;exact与options中的设定同chi-square。点击OK:
由于本例题中样本含量为50,np与n(1-p)均大于5,故系统采用正态近似法(Z Approximation),其P值为0.480,所以认为该硬币是均匀的。
*注意:该过程默认计算第一项的概率,在本题中即计算正面发生的概率
*试分析:根据以往经验,新生儿染色体异常的概率为1%,某医院观测了当地共136名新生儿,发现1例染色体异常,问该地新生儿染色体异常的概率是否低于一般情况?
Runs:
游程检验主要用于分析取值为二分类,并且按时间或某种顺序排列的资料是否其出现的情况为随机的。比如对于某阳性/阴性结果,按照其出现的时间顺序排列:+++――++-+――;前面有三个连续的阳性结果作为一个游程,随后连续两个阴性结果作为第二个游程,以此类推,整个序列有六个游程;如果阳性和阴性结果出现的情况是随机的,那么游程的总数既不应该太少(太少意味着缺乏独立性,总体内部存在着一定的趋势或结构,这有可能表示观测值间不独立如传染性疾病,也有可能表示来自不同的总体)同时也不应该太多(如果太多表示总体中存在系统性的短周期波动,那么这样的序列同样不是随机的)。
可见游程检验关心的主要是样本中二分类变量出现的随机性;其检验效能通常认为
文档评论(0)