- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卡方检验与相关分析课件
第五章 相关分析与检验 相关分析之一——有关与无关 寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。 在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。 性别与四级英语考试通过率的相关统计 表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。 自变量的不同取值在因变量上无差异,两变量无关。 自变量的不同取值在因变量上有差异,两变量有关。 统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。 自变量 因变量 变量关系的统计类型 相关分析之二——关系强度 变量关系强度的含义:指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 B)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量的变化来解释。 一、列联相关(第四章已讲) (一)列联分析的基本原理 自变量发生变化,因变量取值是否也发生变化。 比较边缘百分比和条件百分比的差别。 卡方测量用来考察两变量是否独立(无关)。 二、相关分析(Correlate) (一)简介 相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同等的地位。检验的原假设为相关系数为0。可选择是单尾检验还是双尾检验。 在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程(二变量相关分析)、Partial过程(偏相关分析)、 Distances过程(距离分析)。 (二)相关分析类型 Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。 Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。 Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析,一般不单独使用,而作为因子分析等的预分析。 (三)Bivariate相关分析 在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能得出错误结论。 Bivariate相关分析的步骤:输入数据后,依次单击Analyze—Correlate—Bivariate,打开Bivariate Correlations对话框 Bivariate Correlations 对话框 Pearson复选框 选择进行积差相关分析,即最常用的相关分析,其计算连续变量或等间隔测度变量间的相关系数。计算该相关系数时,不仅要求两相关变量均为正态变量,而且样本数(N)一般不应少于30。 Kendall‘s tau-b复选框 计算Kendall’s等级相关系数,其计算定序变量间的线性相关关系。(有打结现象时) Spearman复选框 计算Spearman相关系数。也是计算等级相关系数(定序与定序)。最常用的非参数相关分析(秩相关),适用于连续等级资料。 (无打结现象) 以上三种相关分析可以选择其中之一,也可以同时多选。如果参与分析的变量是连续变量,选择Kendalls tau-b或Spearman相关,则系统自动对连续变量的值先求秩,再计算其秩分数间的相关系数。 Flag significant correlations 用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P0.05的系数值旁会标记一个*,P0.01的则标记两个**。 Options 对话框 对每一个变量输出均值、标准差和无缺省值的观测数。 对每一个变量输出交叉距阵和协方差距阵。 计算某个统计量时,在这一对变量中排除有缺省值的观测值。 对于任何分析,有缺省值的观测值都会被排除。 一般,如果r的绝对值大于0.8,则认为两变量之间具有较强的线性相关关系;如果r小于0.3,则认为两变量之间具有较弱的线性相关关系。当然,相关关系的程度与样本的容量大小也有很大的关系。 例1:为研究高等院校人文社会科学研究中立项课题数会受哪些因素影响,收集1999年31个省市自治区部分高校有关社科方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(上年)、发表论文数(上年)之间是否具有较强的线性关系。 可以画散点图先进行判断。 Graphs-legacy-scatter Analyze-correlate--Brivariate 例2:定序变量的Spearman分析实
文档评论(0)