SPSS统计分析第7章 相关分析.ppt

第七章;;7.1相关分析简介;;;7.1二元变量相关分析;7.1二元变量相关分析;7.2 二元变量相关分析;第2步 对样本来自的两总体是否存在显著的线性关系进行推断:由于存在抽样的随机性和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的两总体是否具有显著的线性相关性,需要通过假设检验的方式对样本的总体进行统计推断。 提出零假设H0:即两总体无显著的线性关系; 构造检验统计量:由于不同的相关系数采用不同的检验统计量,因此在相关分析时,不同的过程需要构造不同的检验统计量; 计算检验统计量的观测值及对应的概率p值; 对两总体的相关性进行推断:如果检验统计量的概率p值小于给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性线性关系;反之,应接受零假设。 ;(4) SPSS实现举例 【例7-1】为了分析父亲与儿子身高之间的相关性,现抽样了12对父子的身高,数据如下表。请对其进行相关性分析(显著性水平取α=0.05)。 ; ; ;;(1) 基本概念 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。偏相关系数的数值和简单相关系数的数值常常是不同的,在计算简单相关系数时,所有其他自变量不予考虑。 (2) 统计原理 控制一个变量和控制两个变量的偏相关系数分别为:;检验的统计量为:;(4) SPSS实现举例 【例7-3】 下表是四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。 ;7.3 偏相关分析;第4步 主要结果及分析。;;(1) 基本概念 距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。 (2) 统计原理 不相似性测度 对定距数据的不相似性(距离)测度可以使用的统计量有:欧几里得距离、平方欧氏距离、切比雪夫距离、Block距离、明可斯基距离等。 对定序数据,主要使用卡方不相似测度和斐方测度。 对??值(只有两种取值)数据变量之间的距离描述,使用欧氏距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。;相似性测度 对于定距数据主要使用皮尔逊相关系数和夹角余弦距离; 对于二值数据的相似性测度主要包括简单匹配系数、Jaccard相似性指数、Hamann相似性测度等20余种。 ;(4) SPSS实现举例 【例7-4】 已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。;第1步 分析:这是考查4个城市的日照时数是否相似的问题,可用距离分析实现。既可以计算其相似性测度,亦可计算其不相似性测度; 第2步 数据组织:分别定义的变量:month”(月份)(用字符型变量)、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”(石家庄)、“Dalian”(大连)。;7.4 距离分析;第4步 主要结果及分析。;

文档评论(0)

1亿VIP精品文档

相关文档