第5讲 相关分析..pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二元变量的距离测度 其中,a,b,c,d分别表示满足条件的变量对个数。 例3 已知有我国六城市2004年各月的日照时数数据如表所示。请分析各城市日照数是否近似。 (数据文件:rizhao.sav) 二、引例(练习三) 【Analyze】/【Correlate】/【Distance】 进行距离分析的变量 标识变量,方便阅读输出结果 定义距离分析的类型 对变量进行距离分析 对观测值进行距离分析 选择距离分析的测度类型 计算不相似性测度 计算相似性测度 【Dissimilarities】对应的【Measures】框:根据变量或观测值数据类型的不同,选择不同的不相似测度即距离测度指标。 计算定距变量的距离测度 计算分类变量的距离测度 计算二元变量的距离测度 定义数据标准化的方法 定义计算出来的距离测度作进一步的转化 绝对值转化法 变号转化法 将距离测度转化到(0,1)区间 数据标准化方法: (1)None:不变化; (2)Z sores:进行Z变换; (3)Range -1 to 1:将数据标准化到-1~1之间; (4)Range 0 to 1:将数据标准化到-1~1之间; (5)Maximum magnitude of 1:将数据标准化后使其最大值为1; (6)Mean of 1:将数据标准化后使其均值为1; (7)Standard deviation of 1:将数据标准化后其标准差为1. 【similarities】对应的【Measures】框:根据变量或观测值数据类型的不同,选择不同的相似测度。 计算定距变量的相似测度 计算二元变量的相似测度 结果解读: 1、变量观测值数及其缺失值情况 取值越大说明近似程度越低,反之亦然 2、距离分析结果表 要求掌握相关分析【Correlate】子菜单: 1、【Bivariate】过程(两变量相关分析) 2、【Partial】过程(偏相关分析) 3、【Distances】过程(距离分析) 注: 两变量相关分析与偏相关分析主要用于研究两变量的相关关系。 当两变量的取值受到其他变量的影响时,要采用偏相关分析方法控制其他变量的影响,研究两变量间的相关关系;如果要分析同一变量内观测值之间或者多个变量之间的相似或不相似程度,则需要采用距离分析方法。 本作品采用知识共享署名-非商业性使用 2.5 中国大陆许可协议进行许可。 专业交流 模板超市 设计服务 NordriDesign中国专业PowerPoint媒体设计与开发 本作品的提供是以适用知识共享组织的公共许可( 简称“CCPL” 或 “许可”) 条款为前提的。本作品受著作权法以及其他相关法律的保护。对本作品的使用不得超越本许可授权的范围。 如您行使本许可授予的使用本作品的权利,就表明您接受并同意遵守本许可的条款。在您接受这些条款和规定的前提下,许可人授予您本许可所包括的权利。 查看全部… 第5讲 相关分析 第一节 相关分析概述 统计研究的主要内容: 第一部分:总体均值的差异比较 第二部分:变量间的统计关系的研究 变量和变量之间的关系可以分为: 确定性关系:变量之间的关系可以用精确的函数描述出来。 不确定性关系:变量之间存在某种联系,但是这种联系是不能用精确的函数描述出来。 如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是相关分析。 如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。 可见相关分析是研究变量间不确定性关系的一种统计方法,而回归分析更倾向于研究变量间的确定性关系。 【Correlate】子菜单: Bivariate:两变量相关分析。 Partial:偏相关分析。 Distances:距离分析。 第二节 两变量相关分析 一、两变量相关分析简介 两样本相关分析即是研究两个变量之间相关关系的统计方法。 它主要由相关系数来刻画。 二维随机变量(X,Y)的相关系数 可见,相关系数越大,相关性越强。 通常情况下, 是未知的,而是用其样本相关系数r来代替。 ◆思考:为什么 是未知的? 常用的样本相关系数有: Pearson相关系数 Spearman秩相关系数 Kendall相关系数 Pearson相关系数:用于对定距变量的数据进行计算,即分析两个连续性数据之间的关系。 ◆ 注意: Spearman秩相关系数 :用于描述分类或等级变量之间、分类或等级变量与连续变量之间的相关关系。

文档评论(0)

586334000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档