- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
讲座6-非参数讲义
第6讲 非参数检验 主要内容 非参数检验和参数检验的区别 各种非参数检验及其应用条件 单样本非参数检验方法及其结果的解释 独立样本非参数检验方法及其结果的解释 相关样本非参数检验方法及其结果的解释 非参数检验简介 参数检验方法检验的内容是总体分布的某些参数,例如均值,方差,比率等 。 非参数检验主要用于不考虑被研究对象的总体分布,或对总体的分布不做任何事先的假定的检验。 非参数检验的内容不是总体分布的某些参数,而是检验总体某些有关的性质,例如总体的分布位置、分布形状之间的比较,或者各样本所在总体是否独立等。 非参数检验方法的优点 稳健性:因对总体分布的约束条件放宽,从而对一些离群值或极端值不至于太敏感。 使用范围广:对数据的度量标准(或测量测度)无约束,定序数据、定量数据都可;部分数据缺失也可;小样本、分布未知样本、数据污染样本、混杂样本等都可以应用非参数方法。 非参数检验的应用范围 参数检验方法的条件不满足。例如样本来自的总体不服从正态分布,T检验不适用,必须应用非参数方法来比较两个总体的中心趋势。 研究定类变量和定序变量之间的关系。 SPSS非参数检验 新的用户界面统一了方法的选择,根据样本的个数来组织方法。 非参数统计过程仍然保留了SPSS18以前的非参数检验的界面,称为“旧对话框”,它的输出仍然为传统的表格方式展现检验结果。同时可以选择输出描述性统计量和四分位数,而新用户界面下没有。 在非参数检验过程的对话框和帮助文档中,把以前熟悉的变量(Variable)称为字段(field)。 单样本非参数检验 SPSS的单样本非参数检验方法包括: 二项(分布)检验 比较观察分布二项期望分布是否相同。 对仅有两个类别的变量进行;但也可把连续变量变为2分类变量,进行二项。 卡方检验 比较观察频率与期望频率的差距。 对多个分类变量进行检验。一般用于定性变量。 Kolmogorov-Smirnov检验 比较样本累计分布函数是否为某既定分布。 一般用于连续数据。 Wilcoxon符号检验 比较观察中位数与假设中位数。用于比较连续变量。 游程检验 比较检验变量的值序列是否为随机序列。 所有类型变量都适用。 卡方检验 卡方检验是一种常用的对总体分布进行检验的非参数检验方法。 例如,医生研究心脏病人猝死人数与日期的关系,检验现在的人口结构和十年前是否一样,血型是否和人的性格有关系,现代社会中受过高等教育、高中毕业、初中毕业、小学毕业和文盲的比例是否为3:6:10:2:1等问题都可以通过卡方检验来实现。 卡方检验的原理(1) 卡方检验的原假设是: H0样本来自的总体的分布与假设的分布(又称期望分布或者理论分布)无显著差异。 卡方检验的基本思想是,如果从一个随机变量X所在的总体中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观测频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。 卡方检验的原理(2) 如果变量X有k个互不相交的子集,在成立的条件下,变量值落在第i个子集的频数设为;设实际观测到的第i个子集的频数为,则有以下Pearson卡方统计量 卡方检验的原理(3) 卡方统计量服从自由度为k-1的卡方分布。如果卡方值较大,则说明期望频数与观测频数分布差距较大,没有证据支持原假设;反之,卡方值较小,说明期望频数与观测频数比较接近,不能拒绝原假设的论断。 卡方检验例子 数据文件dischargedata.sav记录了Winnipeg医院每天的病人流量。医院管理者需要了解是否一周中每天的病人流量是相同的。 Discharg列为日均病人流量。 原假设: 星期一到星期六、星期日每天的病人流量是相等的。 SPSS实现卡方检验 选择【分析】-【非参数检验】 -【单样本】 在设置标签上,选择“比较观察可能性和期望可能性” 在字段标签上,选择变量“day” 选项设置 检验结果分析 聚类条形图显示检验字段每个类别的观察频率和假设频率。悬停在条形上将在工具提示中显示观察频率和假设频率及其差别(残差)。观察和假设条形中的可见区别表明检验字段可能没有假设的分布。 二项式检验 SPSS的二项式检验通过样本数据检验样本来自的总体是否服从指定的二项分布。例如,现代社会男、女的比例是否为1.01:1;工厂的次品率是否为1%等都可以通过二项式检验完成。 用于变量取值只有两种。 如性别变量只有男、女 产品只有合格、不合格。 筛子只有奇数、偶数。 二项分布记为B(n,p) n为重复试验次数 p为出现成功的概率 打开telco.sav 一家电信公司每月大约27%的客户会流失。为减少客户流失,分析原因,经理想分析不同客户群流失的比例是否有显著差异。 步骤
文档评论(0)