本章内容 7.1 单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两配对样本的非参数检验 7.5 多配对样本的非参数检验 非参数检验 非参数检验: (1)在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。 (2)推断过程中不涉及有关总体分布的参数。 7.1 单样本的非参数检验 1.目的:样本来自总体的分布是否与某个已知的分布相吻合? —绘制样本数据的直方图、pp图、QQ图判断—粗略 —通过非参数检验—精确 2.单样本非参数检验 (1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K-S检验、变量值随机性检验等。 7.1.1总体分布的卡方检验 1.基本思想-吻合性检验 (1)原假设:样本来自的总体分布与期望分布无显著差异。 变量值落入第i个子集中的理论概率为 ,相应的期望频率为 2.实现步骤 [Analyze]-[Nonparametric Tests]-[Chi-Square] (1)选定待检验的变量到[Test Variable list] (2)在[Expected Range]中确定参与分析的观测值的范围: [Get from data]:所有观测数据都参与分析 [use specified range]:只在该取值范围内的观测数据才参与分析。 (3)[Expected values]给出各理论值 [All categories equal]:所有子集的频数都相同 [value]:依次输入值,通过[add]、[change]、[remove]进行增加、修改和删除。 3.应用案例 医学研究表明心脏病人猝死人数与日期的关系为:一周内,星期一猝死者较多,其他日子基本相当,各天的比例近似为:2.8:1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理论分布相吻合。 分析: 利用总体分布卡方检验实现。 7.1.2二项分布检验 1.基本思想 (1)通过样本数据检验样本来自的总体是否服从指定概率p的二项分布。 (2)小样本-精确检验 大样本-近似检验 2.实现步骤 [Analyze]-[Nonparametric Tests]-[Binomial] (1)选定待检验的变量到[Test Variable list] (2)[define dichotomy]中指定如何分类 [get from data]:检验变量为二值变量 [cut point]:输入具体数值,大于等于该值的为第一组,大于该组的为第二组 (3)[Test proportion]:输入二项分布的检验概率值 3.应用案例 利用“产品合格率”数据,推断该批产品的一级品率是否为90% 分析: 产品合格与否属于二值变量,可以通过二项分布检验实现。 7.1.3单样本K-S检验 1.基本思想 (1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D (4)原假设成立时: ①小样本下:D~kolmogorov分布 ②大样本下: 近似服从K(x)分布 ③SPSS仅给出大样本下的 和对应的p值 (5)决策 ①D统计量的p值显著性水平,拒绝原假设,样本来自的总体与指定分布有显著差异 ②D统计量的p值显著性水平,不拒绝原假设,样本来自的总体与指定分布无显著差异 2.实现步骤 [Analyze]-[Nonparametric Tests]-[1-sample K-S] (1)选定待检验的变量到[Test Variable list] (2)[Test distribution]:选择理论分布 ①[normal]:正态分布 ②[uniform]:均匀分布 ③[poisson]:泊松分布 ④[exponential]:指数分布 3.应用案例 利用“儿童身高”数据分析周岁儿童身高总体是否服从正态分布。 分析: 可以通过单样本K-S检验实现。 7.1.4 变量值随机性检验 1.基本思想 (1)通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。 (2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相同的变量值的次数。 ②游程数太大或太小都表明变量值存在不随机的现象 (3)检验统计量 (4)决
原创力文档

文档评论(0)