- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5讲单样本非参数检验4游程检验.ppt
第5讲 单样本非参数统计—4 游程检验 传统的非参数统计 单样本非参数检验 两样本(独立和相关)非参数检验 多样本(独立和相关)非参数检验 主讲方法: ◆卡方检验 ◆二项分布检验 ◆科尔莫戈罗夫-斯米尔诺夫(Kolmogorov-Smirnov) 检验 ◆游程检验 检验用途:数据的随机性 抽样调查的基本原则是随机性。 什么是随机性?是指样本中的所有数据都可以看成是独立同分布的。 数据不随机的情况举例: 1有上升趋势; 2有下降趋势; 3有周期趋势; 为什么?(下页) 插补: 若游程过少,如2个游程:0,0,0,1,1,1,则规律性明显,不是随机的。 若游程过多,如6个游程:1,0,1,0,1,0,则同样是有规律性变量,不是随机的。 举例:男女生排座 前面分析表明:游程个数过大或过小都是不随机的,而游程个数居中则是随机的。因此,可构造统计量R,表示游程的个数。再确定该统计量的分布,则可查表确定拒绝域和接受域,从而进行假设检验。 游程检验分布表如下: 分别记两组的样本容量分别为n1和n2,哪个为n1都可以。 游程检验分布表 游程个数R 游程检验分布表 案例1 设0-1变量的样本数据为: 0,1,1,1,1,1,0,1,1,0,1,1,1,1,0,1,0,1,1,1,0,0,0,1,1,1 共26个数据。令显著性水平α=0.05,问数据是否随机取得? 计算过程: n1=8,n2=18,R=12 α=0.05,查游程检验分布表,得 左临界值为7,右临界值为17,可知R落入了接受域,接受原假设,认为是随机的。 游程检验的R软件操作 所在包:tseries 命令:runs.test(x),x是二分类变量 实战:准备,把文件runs.csv复制到我的文档 library(tseries) data=read.csv(runs.csv) x=data$x runs.test(factor(x)) R游程检验例2 x=c(0,1,1,1,0,0,0,1,1,1,1,1) y=factor(x) library(tseries) runs.test(y) 大样本时的游程检验 当n1和n2都小于等于20时,查游程检验临界值表;若有一个大于20时,构造如下统计量(P63): 它近似服从标准正态分布。 案例2 令α=0.05,问上面样本数据是否随机? 计算提示 大样本,所以游程统计量近似服从标准正态分布。 m=10,n=40,R=13 γ=m/n=0.25,代入公式可求出游程统计量的值(-1.81),再查标准正态分布表,得临界值为正负1.96。 因此,落入接受域,数据是随机的 R操作 library(tseries) x=c(1,1,1,0,1,1,1,1,1,1,1,0,1,1,0,0,1,1,1,1,1,1,0,1,1,1,1,0,1,1,1,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1) x1=factor(x) runs.test(x1) 案例3 解决思路 解:中位数为204.6,将小于204.6的设为0,大于204.6的设为1,可得二分变量。 大家来完成。 答案 SPSS操作: 用前面数据操作。 P值=0.022,小于0.05,拒绝原假设,认为数据不具有随机性 手工计算,结果又如何?大家完成 library(tseries) x=c(156.0,255.5,132.0,246.7,867.9,86.4,610.4,125.7,150.4,117.6,201.9,207.2,189.8,585.8,153.1,565.4,511.0,567.0,222.3,141.5) m=mean(x) x1=x-304.68 x2=(x10) x3=factor(x2) runs.test(x3) R代码2 library(tseries) x=c(156.0,255.5,132.0,246.7,867.9,86.4,610.4,125.7,150.4,117.6,201.9,207.2,189.8,585.8,153.1,565.4,511.0,567.0,222.3,141.5) x1=factor(sign(x-median(x))) runs.test(x1)
您可能关注的文档
最近下载
- ICD-9-CM-3手术与操作国家临床版亚目表.xlsx VIP
- 图形创意(第二版)林家阳 高教 全套课件.ppt
- Unit 2 Helping at home 第1课时 Get ready(教学课件)英语外研版三起四年级上册(新教材).ppt
- 大数据精准营销PPT课件.pptx VIP
- 天线与电波传播课件(第六章)电波传播概论.ppt VIP
- 公司目视化管理手册..pptx VIP
- 非遗工艺数字化呈现的2025年文化传承项目阶段汇报PPT.pptx VIP
- 演讲与口才中职全套完整教学课件.pptx
- CNG及LNG加气站风险管控资料.doc VIP
- 一种拉曼-荧光双模生物传感器及其制备方法与其在miRNA检测中的应用.pdf VIP
文档评论(0)