相关分析与回归修改.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 相关分析――Correlate 在统计问题中,经常遇到要分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用下一章将要讲述的回归分析来实现,后者则需要用到本章所要讲述的相关分析实现。 ? 第一节 简单相关分析 1.相关系数 相关关系:变量之间有关,但又不能由一个或几个变量去完全唯一确定另一个变量取值的关系(或很难用函数关系表达出来)。相关关系的密切程度用简单相关系数(在不引起混淆的情况下,简称相关系数)反映,用r表示,其值在-1到+1之间,绝对值愈接近1,表明密切程度愈高,关系愈密切;愈接近0,表明密切程度愈低,关系愈不密切。 注:对数值可以从小到大排列的数据才能计算其相关系数。例如不能计算宗教信仰与颜色喜好之间的相关系数。 使用等间隔测量的变量间的相关系数采用积矩相关,公式为: 在用相关系数时,要进行检验。原假设:r=0 对显著性水平α,自由度n-2,查表得临界值rα,若rrα,则显著。 注:若n很大,即使r很小,也很容易得到“显著”的结论。因而在相关分析的过程中,除说明是否显著外,还应对r 的大小加以说明。 一般情况下,可以这样判断 :相关系数不低于0.7高度相关,小与0.4低度相关,否则中度相关. SPSS软件的操作步骤 SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,它一般包括以下三个过程: Bivariate过程 此过程用于进行两个/多个变量间的参数/非参数相关分析,如果是多个变量,则给出两两相关的分析结果。这是Correlate子菜单中最为常用的一个过程,实际上我们对他的使用可能占到相关分析的95%以上。下面的讲述也以该过程为主。 Partial过程 如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数,这种分析思想和协方差分析非常类似。Partial过程就是专门进行偏相关分析的。 Distances过程 调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。 Bivariate过程 建立或调用数据文件,选择“Analyze”→“Correlate”→“Bivariate”项,将变量放入“Variables”框。 1、三种相关系数 Pearson:积差相关,用于连续变量或等间距测度的变量。我们经常用的样本相关系数。 Kendall′s tau-b:等级相关,计算分类变量间的秩相关。 Spearman:等级相关,计算斯皮尔曼相关。 当变量不服从正态分布或总体分布未知时,可使用Kendall′s tau-b 或Spearman相关。 Kendall‘s 和Spearman相关系数,是非参数相关系数。是根据数据的秩而不是根据实际值计算的。适用于有序数据或不满足正态分布假设的比例变量。 2、选择显著性检验类型 Two-tailed:双尾检验,用于事先不知道相关方向(即正相关还是负相关)的情况。 One-tailed:单尾检验,用于事先知道相关方向的情况。 双尾、单尾检验也称为双侧、单侧检验。双侧检验时,当原假设被拒绝后,还有两种可能,显著性水平α分布在图形的两侧。有时,在进行检验前,可以判定一种情况不成立,当原假设被拒绝后,只剩下一种情况了。 在同一显著性水平下,由于单侧检验的临界值比双侧检验的临界值靠近总体均值,因此,容易检验出显著性差异来。 Flag significant Corrlations:选中此项,用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P0.05的系数值旁会标记一个星号,P0.01的则标记两个星号。 3 、Options选项 Statistics栏: Means and standard deviations:输出均值与标准差。 Cross-productdeviations and covariances:输出叉积离差阵和协方差阵。 Missing Values栏: Exclude cases pairwise:剔除本计算变量含有缺失值的数据。 Exclude cases listwise:剔除所有计算变量含有缺失值的数据。 应用实例 例1 为研究学生的平时作文成绩x与高考作文成绩y的关系,随机抽取10名考生,数据见“zuowen”,试进行相关分析。 选择“Analyze”→“Correlate”→“Bivariate”项,将变量x、y放入“Variables”框;选中“pearson”项、“Two-tailed”,按“Opti

文档评论(0)

today-is-pqsczlx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档