- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非参数统计学讲义第五章相关与回归
非参数统计学讲义
主讲:统计系 袁靖
第五章 相关和回归
§1 引言
所谓相关,是指两组或两组以上观察结果之间的连带性或联系。换句话说,也就是各组观察结果所反映的特性之间有关系。如几个亲生兄弟间的智商与出生顺序有关系,受教育程度与性别有关系,出生率X和文盲率Y之间的关系等等。在实际问题的研究中,人们常常想知道两组或两组以上的观察结果是否有联系,同时也想知道联系的程度如何。前面的统计检验能够在一定的显著性水平上,确定各组观察值的关系是否存在。
相关方法被用来度量两个或更多变量之间的线性关系的强度,是回归分析的基础。
在数理统计学中,我们使用相关系数定义变量X和变量Y之间的相关性。
对于样本,,……,来说,Pearson相关系数为
如果在这个样本中的n个观察值独立,则r是的渐近无偏估计;如果它又是二元正态分布,则r是的ML估计。
为了检验,,可以选取统计量
结论:Pearson相关系数度量的是一种线性关系,而我们所要介绍的非参数的Spearman秩相关系数和Kendall τ相关系数实际上度量的是一种形式的相依联系,或是更广义的单调关系。因此相关的概念被推广,不仅指线性相关,而泛指相依或联系。
§2 两个样本的相关分析
等级相关
等级相关(Rank Correlation)也称作级序相关,用于两个至少是定序尺度测量的样本问相关程度的测定研究背景
基本方法
两个样本X、Y,其观察数据可以配对为,,……,。排序后评秩,其秩记作U,与相对应的秩为;同样,排序后评秩,秩记作V,与相对应的秩为。这样得到的n对秩,,…,可能每一对完全相等,也可能不等。由于每一样本都是n个数据评秩,因此与的取值都是从1到n。X、Y的秩可能完全一致,即对于所有的i来说,有=,表5—1是完全一致的评秩结果。X、Y的秩可能完全相反,表5—2是完全相反的评秩结果。如果X、Y完全相关,应该对于所有的i有=,即—=0。因此,与之差可以用来度量X、Y的相关程度。定义
表5-1 完全一致的评秩
X的秩 Y的秩 1 1 2 2 … … n-1 n-1 n n 表5-2 完全相反的评秩
X的秩 Y的秩 1 n 2 n-1 … … n-1 2 n 1 则两组秩完全相关时,(i=1,2,…,n)应该为零。越大,X、Y之间的相关越不完全。但由于可正可负,直接用测度相关,会出现正负抵消,而不能真实反映与差值的大小,所以宜采用,即
(5.3)式的这个秩差值平方和的大小既受到n的多少的影响,又受到两组秩不一致程度的影响,因此,采用相对的测量指标有利于说明X、Y的相关程度。因为的最大值反映X、Y完全不相关的情况,所以,用(5.3)式除以的最大值,可用来评价X、Y之间秩的差值是否与完全不相关时接近。若实际计算的与X、Y完全不相关情况下的接近,那么两个样本的相关程度较低,若实际计算的与最大值的比越小,则两个样本的相关程度越高。的最大值即X、Y间完全不相关情况下的秩差值平方和,可以根据表5—2所列的数据计算。因为这是X、Y完全不相关的评秩结果。的最大值为
(5.4)式的中括号内最后一项,当n为奇数时是22;n为偶数时是12。
(5.3)式除以(5.4)式得到
(5.5)式的取值从0到1。根据表5-1中的数据计算(5.5)式值为0,表5-2中的数据计算的(5.5)式值为1,即X、Y的秩完全一致时,(5.5)式的值为0,X、Y的秩完全不一致时,(5.5)式的值为1。
测度两个样本等级相关程度可以象参数方法一样,定义等级相关系数作为标准。斯皮尔曼的等级相关系数(Spearman coefficient of rank correlation)是测定两个样本相关强度的重要指标。其计算公式为
斯皮尔曼相关系数也写为,在有下标注以s是为表明这个相关系数r不是积矩相关的简单相关系数,而是等级相关的Spearman相关系数。
注:①由于(5.6)式与(5.5)式不同,所以,R的取值从一1到十1,表明X、Y完全相关,R=十l为完全正相关,R=一1为完全负相关。越接近于l,表明相关程度越高,反之,越接近于零,表明相关程度越低,R=0为完全不相关。R>0为正相关,R<0为负相关。通常认为为相关程度较高。
②Spearman秩相关系数检验临界值查表可得,P198。
③存在打结时,Spearman统计量要作相应修正。
④在大样本时,可用正态近似作检验。
应用
【例5-1】经济发展水平和卫生水平之间的相关分析
对某地区12个街道进行调查,并对经济发展水平和卫生水平按规定的标准打
您可能关注的文档
- 长汀县生态环境状况调查.doc
- 长江三峡链子崖危岩体概况.doc
- 长沙到张家界旅游-十一长沙到张家界旅游乘车路线.doc
- 长沙红盾网工商年检网上申报系统操作流程.doc
- 长沙蛋糕市场调查报告.docx
- 长虹维修简报第4期(带简章).doc
- 门洞尺寸测量指导书.doc
- 长途汽车信息管理系统的设计与实现.doc
- 门禁系统需求规格说明书.doc
- 门诊护士工作站岗位操作书.doc
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)