- 1、本文档共129页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[经管营销]第7章 非参数检验
第7章 非参数检验 目录 非参数检验简介 单样本的非参数检验 两独立样本的非参数检验 两配对样本的非参数检验 多独立样本的非参数检验 多配对样本的非参数检验 非参数检验简介 非参数检验是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分市形态作简单假定,但却又希望能从样本数据中获得尽可能多的信息,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。出于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。 非参数检验的优缺点 检验条件比较宽松,适应性强,但此时由于损失了部分信息,检验效率降低了 参数检验假定总体分布正态或近似正态或以正态分布总体为基础构造t 分布或 分布来检验总体均值或方差是否发生显著性变化,这些条件是相当严格的。如果这些条件不存在,很可能检验结果产生方向性的错误。非参数检验不受这些条件的限制,大大填补了参数检验的不足。但非参数检验缺乏针对性,其功效不如参数检验。其检验用的是等级或符秩,而不是实际数值,方法简单,又会失去许多信息,因而检验的有效性也就比较差 检验的方法比较灵活,用途更广泛。 非参数检验不但可以应用于定距、定比变量的检验而且也适用于定类、定序变量的检验,对于那些不能直接进行加减乘除四则运算的定类数据和定序数据,运用符号检验、符号秩检验都能起到比较好的效果 计算相对简单,易于理解 由于非参数检验不用计量的方法,而用计数的方法,其过程及其结果都可以被直观地理解。 对于适合参数检验的资料,最好还是用参数检验 单样本的非参数检验 Chi-Square test 卡方检验 Binomial test 二项分布检验 Runs test 游程检验 1-Sample Kolmogorov-Smirnov test 单样本K-S检验 卡方检验 Chi-Square test 实例:心脏病人猝死人数与日期的关系 收集168个观测数据。其中用1、2、3、4、5、6、7表示是星期几死的。而人数分别为55、23、18、11、26、20、15。每天的比例近似为2.8:1:1:1:1:1:1 ? 推断心脏病人猝死人数与日期的关系是否为2.8:1:1:1:1:1:1 ?换句话说,心脏病人每天猝死的概率是否为上述理论分布 显然,该变量是离散型数据,对该变量的总体分布采用卡方检验方法 卡方检验的基本思想 根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于多项分类值总体分布的分析。 H0:样本来自的总体分布与期望分布或某一理论分布无显著差异,即 F=F0 通常采用皮尔逊卡方检验 将样本观测值x1,…,xn分成k组,以vi,vi/n分别表示样本落入第i个小区间[ti-1,ti)(i=1,…,k)的频数和频率。 如果H0为真,计算由F0决定pi pi=F0(ti)-F0(ti-1) 显然,npi为样本落入第i个区间的理论频数,当H0成立时,理论频数npi与实际频数vi应该很接近,即 应很小,从而 也应该很小,当n较大时,此统计量近似服从 ,检验p值定义为 当F0=F?, ?为m维参数时,可先利用样本估计出?,然后再计算pi, 此时卡方统计量近似服从自由度为k-1-m 卡方检验的基本操作 Analyze- Nonparametric Tests-Chi Square Test Variable: 死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.2560.5,不能拒绝零假设,认为心脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 二项分布检验 Binomial test 二项分布:在现实生活中有很多的取值是两类的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是p,则另一类出现的概率就是1-p。这种分布称为二项分布。 H0:样本来自的总体与指定的二项分布无显著差异 即 SPSS二项分布检验,在小样本中采用精确检验方法,对于大样本则采用近似检验方法。 小样本检验 记 ,由于p的无偏估计为x/n,因此,如原假设不成立,则x会比较大,或比较小,故可取检验统计量为x
文档评论(0)