- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十五章 相关分析
相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。
一、理论知识
相关类型:
1、直线相关:两变量呈线性共同增大,或一增一减。
2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。
相关的方向 依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。 1、正相关:一种变量增加或减少,另一种变量也在增加或减少,两种变量变动的方向相同,谓之正相关。 2、负相关:一种变量增加或减少,另一种变量也在减少或增加,两种变量变动的方向相反,谓之负相关。 3、无相关:在两种变量之间,一种变量变动时,另一种变量毫无变动,即使变动也无一定的规律,如人的相貌与人的思想品德, 人的身体高矮与学习成绩的好坏等是无什么关系的,这两种变量的关系谓之无相关或零相关。
相关分析基本步骤:
绘制散点图
计算相关系数
进行相关系数检验
计算相关程度的统计量以及针对的数据类型:
1、Pearson积差相关系数
两个连续变量间呈线性相关时,使用Pearson积差相关系数。要求两变量服从联合正态分布。
注:该相关系数的局限性:
= 1 \* GB3 ①要求变量服从正态分布
= 2 \* GB3 ②只能度量线性相关性,对于曲线相关等更为复杂的情形,积差相关系数的大小并不能代表相关性的强弱。如果Pearson系数很低,只能说明两变量之间没有线性关系,并不能说明两者之间没有相关关系。也就是说,该指标只能度量线性相关性,而不是相关性。(线性相关性隐含着相关性,而相关性并不隐含着线性相关性)
另外:样本中存在的极端值对积差相关系数的影响极大,因此要慎重考虑和处理,必要时可以对其进行剔出,或者加以变量变换,以避免因为一两个数值导致出现错误的结论。
2、Spearman秩相关系数
定义:Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
计算公式:
Spearman相关系数的计算公式完全套用Pearson相关系数计算公式,但公式中的和用相应的秩次代替即可。即:
注:,为两变量各自对应的秩,为对应的秩之差。
?适用范围:
Spearman相关系数更多用于测量两个有序分类变量之间的相关程度。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。若不满足积差相关分析的适用条件时,则使用Spearman秩相关系数来描述变量之间的关系。
? 3、Kendalls tau-b
Kendalls tau-b等级相关系数:侧重于两个分类变量均为有序分类的情况。
4、Contingency Coefficient//Phi and Cramer’s V
侧重于测量两分类变量之间的相关系数。指标的绝对值越大,变量间的相关性越强
5、:偏相关分析
适用于在控制其他变量影响的情况下对两个变量进行相关分析,被分析的两个变量必须服从正态分布。比如说,一般情况下,体重和身高呈正相关,如果还要考虑胸围,则在胸围固定的情况下(如取胸围的平均值,假设所有个体的胸围都校正为相同的情况下)再求体重和升高的相关(偏相关),则偏相关呈负值。
正确运用偏相关分析,可以解释变量间的真实关系,识别干扰变量并寻找隐含的相关性
二、菜单介绍
相关分析通过Correlate 菜单实现,Correlate包含下述子菜单
1、Bivariate 过程
专门用于测量两个/多个变量的间的相关关系。包括Pearson相关(参数相关),Spearman秩相关、Kendall’tau-b非参数相关。
2、Partial 过程:专门用于进行偏相关分析。
三、例题
例题1:见书P272
Pearson 相关系数
练习:死刑的威慑作用是一个广受争论的问题,该表是自1950年起的10 年间,这个国家由于杀人而执行死刑的人数和杀人率之间的数据。这些数据对于死刑的威慑作用的评价有何补充的地方?
次数杀人率685.3874.9715.2514.8714.8654.5524.6544.5414.5414.6
例题2:
Spearman 相关系数
某研究机构对某地区10家市场调查公司进行调查,据此了解有关市场调查公司的质量信心,一项对调查结果的分析给出有关专家对10家市场调查公司机构人员综合分析能力排序和公司发展潜力排序,有关数据如下,能否说明公司职工
文档评论(0)