- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(改)多元数据特征与相关分析
相关关系的类型 相关关系的测度(相关系数) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数? 若是根据样本数据计算的,则称为样本相关系数,r 相关关系的测度(相关系数取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 选择不同的方法计算相关系数 Pearson:双变量正态分布资料,连续变量 Kendall: 资料不服从双变量正态分布或 总体分布未知,等级资料 Spearman:等级资料(非参数检验)。 §1.3 多维数据的数字特征及相关分析 1.3.1 二维数据的数字特征及相关系数 设 是二维总体,从中取得样本数据 , ,… …, 数据观测矩阵 1.样本数据的数字特征与相关系数 2. 二维总体的相关系数 设 是二维总体,定义总体相关系数为 由于观测数据的相关系数是总体相关系数的相合估计,故当n充分大时,有 3.相关分析 3. 相关分析 3)当H0为真时,统计量 t~t(n﹣2) 检验p的值为 对于给定的显著水平?,若p ? ,则拒绝H0,这 时,认为X与Y相关,用样本数据算得的相关系数 反映了两变量的线性关联性的强弱. 式中的t0为通过样本数据算得的统计量t的值. SPSS操作:相关分析 1.做散点图:标题、标目、散点 Graphs-Scattert-Simple-Defind 双击Title加标题、标目 2. 相关分析: Analyze-Correlation-Bivariate-Variables DASC操作 例1.2:一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关? 分析问题:目的、变量、关系 问题:我们能否得出结论:待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61?为什么? 对例子中相关系数必须进行假设检验 例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。 因为,总体相关系数(?)为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。 这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 ??等级相关rank correlation 适用资料:⑴ 不服从双变量正态分布 ⑵ 总体分布类型未知 ⑶ 原始数据用等级表示 3.Spearman相关系数 秩的概念 将一容量为n的样本观测值x1,x2,…,xn 按升序排列成 x(1)≤x(2)≤‥‥‥≤x(n) 若xi = x(k),则称xi 的秩为k,记作Ri,称R1, R2,…,Rn为秩统计量. 3.Spearman相关系数 如下的样本观测值 -0.8, -3.1, 1.1, -5.2, 4.2 按升序排列成 -5.2, -3.1, -0.8, 1.1, 4.2 秩统计量R1,R2,…,Rn的取值为 3, 2, 4, 1, 5 3.Spearman相关系数 设二维总体(X, Y)T 的样本观测数据为 (x1, y1)T , (x2, y2)T , … , (xn, yn)T 对于分量X,其样本数据x1,x2,…,xn的秩统计量是 R1,R2,…,Rn 3.Spearman相关系数 对于分量Y,其样本数据y1,y2,…,yn的秩统计量是 S1,S2,…,Sn 记 3.Spearman相关系数 Spearman相关系数定义为 Spearman相关系数qxy就是把Pearson相关系数rxy 中X,Y的样本值用X,Y的秩来代替的. 3.Spearman相关系数 由于 经过某些运算,可得 可以推出,Spearman相关系数具有Pearson相关系
您可能关注的文档
- 电力拖动自动控制系统运动控制系统版模拟试题.doc
- 电力拖动自动控制系统运动控制系统模拟试题.doc
- 电力术语英文词典(电厂化学).doc
- 电力拖动自动控制系统运动控制系统版思考题答案.doc
- 电力电子应用.doc
- 电力系统潮流计算丰景.doc
- 电力系统规约报文解析.doc
- 电功和电功率复习导学案综合.doc
- 凸分析.ppt
- 平行四边形证明(一),(二) 回顾与思考.ppt
- 小学语文成语大全形容痛苦的成语.doc
- 鸭2025版新高考地理一轮复习选修第48讲环境保护教学案湘教版.doc
- 2024高考生物二轮复习课时作业9生物的变异与进化含解析.doc
- 新高考2024高考生物一轮复习练习14孟德尔豌豆杂交实验一含解析新人教版.doc
- 鸭2025版新高考历史一轮复习第一单元古代中国的政治制度第3讲从汉至元政治制度的演变学案新人教版.doc
- 2024高考物理二轮复习高考题型一选择题专项练4含解析.docx
- 2025届高考英语一轮复习阅读理解分类练习专题05阅读理解之七选五学与练含解析.doc
- 鸭2025版新高考历史一轮复习第十单元世界各国经济体制的创新和调整第27讲空前严重的资本主义世界经济.doc
- 鸭2025版新高考历史一轮复习第十二单元西方人文精神与近现代科技与文化第39讲近代以来世界科技的发展.doc
- 高考语文最新精英时文精选素材十一.doc
文档评论(0)