- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非参数检验:指总体分布不要求服从正态分布或总 体分布情况不明时,用来检验数据资料是否来自某 一个总体的统计检验方法。 通常非参数统计方法适用于以下几种情况: 未知分布型,或样本数太少(n?6)而使得分布状况尚未显示出来; 非参数性,只能以严重程度、优劣等级、 效果大小、名次先后以及综合判断等方式记录其符号或等级; 分布程度偏态; 组内个别随机变量偏离过大。 (1) 首先将数据排序: 7.2 8.2 8.6 8.8 9.4 9.6(2) 10.1 10.2 11.1 (2) 对每一个观测值,计算频率: (3) 将点 逐一点在正态概率纸上; (4) 观察上述n个点的分布. 从图2可以看到,10个点基本在一条直线附近, 故可认为直径与标准尺寸的偏差服从正态分布。 例2 随机抽取某种电子元件10个,测得其寿命数据 如下: 对该10个寿命数据作对数变换,结果见表4。 利用表4中最后两列上的数据在正态概率 纸上描点,结果见图4,从图上可以看到10个 点近似在一条直线附近,说明对数变换后的 数据可以看成来自正态分布。这也意味着, 原始数据服从对数正态分布. 四、 秩和检验 秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W检验,也称Mann-Whitney Z检验。 1、适用资料 1)秩和检验法与参数检验法中独立样本的t检验法相对应。当“总体正态”这一前提不成立时,不能用t检验,可以用秩和检验法; 2)当两个样本都为定序(顺序)变量时,也需使用秩和法进行差异显著性检验。 2、 秩和检验的步骤 1)小样本:两个样本容量均小于10(n1?10,n2?10) (1)将两个样本数据混合由小到大排列秩次(如果大小相同就计算它们的平均秩次); (2)把样本容量较小的样本中各数据的秩次相加,以T表示; (3)建立假设 H0:A = B H1:A ? B (4)检验 把T值与秩和检验表中的临界值比较 T ? T1或T ? T2,则表明两样本差异显著; T1 T T2,则意味着两样本差异不显著。 例5 医学院试验两种新药治疗贫血病人,两个月后病人的红细胞数(万/毫米3)增加的秩次如下表,试问这两种新药有无显著性差异?(?=0.05) 一般,若总体中的个体可按两个属性A与 B分类,A 有r 个类 ,B 有c个类 从总体中抽取大小为n的样本,设 其中有 个个体既属于 类又属于 类, 称为频数,将r?c个 排列为一个r行c列的 二维列联表,简称r?c表。 表1 r?c列联表 表2 二维离散分布表 例8 为研究儿童智力发展与营养的关系,某研究机 构调查了1436名儿童,得到如表3的数据,试在显著 性水平0.05下判断智力发展与营 养有无关系。 若取? =0.05,则 本例中 χ2 =12.896718.307,故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。 例4:某医院一年中出生的婴儿共计1521人,其中男婴802人,女婴719人。给定 α =0.05,试问:能否认为男婴、女婴出生概率相同? 解:用X 表示服从两点分布的随机变量,X 取0, 1两个值,X=1表示男婴,X=0表是女婴。则问题就是检验假设 H0:p1 = P{X=0}=0.5. (1) 将 (-∞, ∞) 分成两个区间 计算每个区间上的理论频数。因为两个区间上 的理论概率 p1= p2=0.5, 而 n=1521, 故 (3) 各区间上实际频数:n1=802, n2=719 . (4) 计算统计量的值 (5) H0 的显著性水平为α的检验 所以,拒绝原假设,即认为男婴女婴出生概率有显著差异。 三、科尔莫哥洛夫检验 卡方检验法的问题 1)分组不同,拟合的结果可能不同; 2)需要有足够的样本含量; 3)对于连续型变量的优度拟合,卡方检验并不是 理想的方法。 统计学家推荐的拟合检验方法是: 1)Shapiro-Wilk检验 2)Kolmogorov-Smirnov检验 思想:比较实际频数与理论频数的累积概率间的差距,找出最大距离D,根据D值来判断实际频数分布是否服从理论频数分布。 科尔莫哥洛夫检验的步骤: 1)把字样观测值从小到大进行排序; 2)算出经验分布函数 3)在原假设H0下,计算观
原创力文档


文档评论(0)