(改)多元数据特征与相关分析.pptVIP

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(改)多元数据特征与相关分析

相关关系的类型 相关关系的测度 (相关系数) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数? 若是根据样本数据计算的,则称为样本相关系数,r 相关关系的测度 (相关系数取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 选择不同的方法计算相关系数 Pearson:双变量正态分布资料,连续变量 Kendall: 资料不服从双变量正态分布或 总体分布未知,等级资料 Spearman:等级资料(非参数检验)。 §1.3 多维数据的数字特征及相关分析 1.3.1 二维数据的数字特征及相关系数 设 是二维总体,从中取得样本数据 , ,… …, 数据观测矩阵 1.样本数据的数字特征与相关系数 2. 二维总体的相关系数 设 是二维总体,定义总体相关系数为 由于观测数据的相关系数是总体相关系数的相合估计,故当n充分大时,有 3.相关分析 3. 相关分析 3)当H0为真时,统计量 t~t(n﹣2) 检验p的值为 对于给定的显著水平?,若p ? ,则拒绝H0,这 时,认为X与Y相关,用样本数据算得的相关系数 反映了两变量的线性关联性的强弱. 式中的t0为通过样本数据算得的统计量t的值. SPSS操作:相关分析 1.做散点图:标题、标目、散点 Graphs-Scattert-Simple-Defind 双击Title加标题、标目 2. 相关分析: Analyze-Correlation-Bivariate-Variables DASC操作 例1.2:一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关? 分析问题:目的、变量、关系 问题:我们能否得出结论:待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61?为什么? 对例子中相关系数必须进行假设检验 例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。 因为,总体相关系数(?)为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。 这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 ??等级相关 rank correlation 适用资料:⑴ 不服从双变量正态分布 ⑵ 总体分布类型未知 ⑶ 原始数据用等级表示 3.Spearman相关系数 秩的概念 将一容量为n的样本观测值x1,x2,…,xn 按升序排列成 x(1)≤x(2)≤‥‥‥≤x(n) 若xi = x(k),则称xi 的秩为k,记作Ri,称R1, R2,…,Rn为秩统计量. 3.Spearman相关系数 如下的样本观测值 -0.8, -3.1, 1.1, -5.2, 4.2 按升序排列成 -5.2, -3.1, -0.8, 1.1, 4.2 秩统计量R1,R2,…,Rn的取值为 3, 2, 4, 1, 5 3.Spearman相关系数 设二维总体(X, Y)T 的样本观测数据为 (x1, y1)T , (x2, y2)T , … , (xn, yn)T 对于分量X,其样本数据x1,x2,…,xn的秩统计量是 R1,R2,…,Rn 3.Spearman相关系数 对于分量Y,其样本数据y1,y2,…,yn的秩统计量是 S1,S2,…,Sn 记 3.Spearman相关系数 Spearman相关系数定义为 Spearman相关系数qxy就是把Pearson相关系数rxy 中X,Y的样本值用X,Y的秩来代替的. 3.Spearman相关系数 由于 经过某些运算,可得 可以推出,Spearman相关系数具有Pearson相关系

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档