Chap08_非参数检验.ppt

Chap08_非参数检验

一、非参数检验概述 一、参数检验:如果已知总体分布的形式,对 总体分布中的某些参数建立假设并进行检验。 这种形式的检验称为参数检验。 二、非参数检验:假定总体分布的具体形式未 知,而是从样本数据本身来获得所需信息,对 总体分布的类型和位置进行检验,这称为非参 数检验。 三、非参数检验的特点: 特点一 特点二 特点三 特点一 特点二 从非参数检验方法对原始数据的要求看: 它不要求有很精确的计量值,可以使用分类数据和顺序数据,非参数检验的处理方法大都基于低精度数据,因而它几乎可以处理任何类型的数据。 特点三 从非参数检验方法的效率看,虽然非参数检验的计算方法名目繁多,有时对某类数据的算法就有多种,但其表现形式一般比较简单并易于理解,依照不同类型数据的不同算法,效率也不同。 二、单样本非参数检验 问题的提出:对获取的样本资料,往往最希望 了解其所属总体的分布形态是否与已知的理论 分布相吻合,或它们是否具有随机性。 拟合优度检验(Chi-Square Goodness-of-Fit Test) 单样本K-S检验(1-Sample K-S Test) 符号检验(Sign Test) 游程检验(Runs Test) 卡方检验 1.适用的条件: 拟合优度检验适用于具有明显分类特征的数据,根据这些样本数据来判断样本所属的总体分布与某一设定分布是否有显著差异,所谓设定分布可以是我们熟悉的理论分布,如正态分布、均匀分布等,也可以是任何想象的分布。 2.需要建立的零假设:样本所属总体其分布形态与设定分布无显著差异。 即: 卡方检验 卡方检验 卡方检验 卡方检验 单样本K-S检验(1-Sample K-S Test) 1. 检验的目的:K-S检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。 2.检验统计量的构造 3. K-S检验的基本步骤 例题三 符号检验(Sign Test) 1. 概念:符号检验是一种利用正、负号的数目对某种假设作出判断的非参数检验方法。它不要求知道被检验量的分布规律,仅依据某种特定的正负号的数目多少来对某种假设做出检验。常被用于检验总体分布有无变化和总体的均值、中位数等参数是否为某一数值。 2.问题的提出 3.统计量的构造 4.检验的标准 5.符号检验的优缺点 例题四 游程检验(Runs Test) 1.游程检验的目的:是检验取值为二分类,并且 按时间或某种顺序排列的数列资料是否确实是 随机出现的,即各观察对象是否来自同一个总 体,并且取值各自独立。 因此游程检验的假设为 :总体某个变量的变量值出现是随机的 游程检验 例题五 三、两个样本的非参数检验 列联表与卡方的独立性检验 两样本的K-S检验 列联表与卡方的独立性检验 1.列联表的基本概念 (1)由两个以上的变量进行交叉分类的频数分布表; (2)行变量的类别用 r 表示, ri 表示第 i 个类别; (3)列变量的类别用 c 表示, cj 表示第 j 个类别; (4)每种组合的观察频数用 fij 表示; (5)表中列出了行变量和列变量的所有可能的组合,所以称为列联表; (6)一个 r 行 c 列的列联表称为 r ? c 列联表. 2.列联表的结构 3.列联表的分布 例题六 例题六 例题六 例题六 例题六 例题六 两样本的K-S检验 四、等级相关分析 Spearman等级相关系数 基本原理 例题八 例题八 Kendall等级相关系数 例题九 例题九 例题九 2.两个重要概念: 游程:连续的相同取值的记录; 游程长度:一个游程所含元素的个数。 3.检验的统计量:游程的总个数R 4.检验方法(给定显著性水平α): 例题五 【例8.5】为了考察两种生产方法对生产效率是否有显著影响,随机抽取了9人用方法A进行生产,抽取11人用方法B进行生产,并记录下这20个人的日产量: A方法:75 69 58 79 69 68 57 89 79 B方法:78 89 98 95 75 78 46 78 96 60 70 问两种方法对生产效率的影响不同吗?(α=0.05) fij 表示第 i 行第 j 列的观察频数 (r ? c 列联表的一般表示) 1.边缘分布 行边缘分布:列观察值的合计数的分布 例如,喜欢饮白酒的有100人,啤酒有120人 列边缘分布:行观察值的合计数的分布 例如,喜欢饮酒的男女性的人数分别为100人,120人 2.条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体

文档评论(0)

1亿VIP精品文档

相关文档