- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3. Descriptive statistics(III) -Multivariate Analysis 周在莹 主要内容 3.1 描述统计量 3.2 数据的分布 3.3 绘图命令 3.4 多元数据的数字特征与相关分析 3.5 多元数据的图形表示方法 3.4 多维数据的简单统计分析 3.4.1 二元数据的数字特征及相关关系 前面的样本数据多来自于一元总体X,而实际情况中,许多数据来自于多元数据总体,即(X1,X2,…Xp)T.这时,我们更重要的是分析各个分量之间的相关关系。 设(X,Y)T为二元总体,从中取得样本(x1,y1)T ,(x2,y2)T,… (xn,yn)T, 即,样本观测矩阵为 二元观测样本的… 均值 X,Y的方差 X,Y的协方差 X,Y的协方差矩阵 X,Y的相关系数 例1 某种矿石有两种有用成分A,B.取10个样本,每个样本中A的含量百分数x(%)及B的含量百分数y(%)数据如下表所示。计算样本的均值、方差、协方差和相关系数。 ore-data.frame( x=c(67, 54, 72, 64, 39, 22, 58, 43, 46, 34), y=c(24, 15, 23, 19, 16, 11, 20, 16.1, 17, 13) ) ore.m-mean(ore); ore.m #均值 x y 49.90 17.41 ore.s-cov(ore); ore.s #协方差阵,与var(ore)同效 x y x 252.76667 60.52333 y 60.52333 17.12544 -cor(ore); ore.r #相关阵 x y x 1.000000 0.919903 y 0.919903 1.000000 3.4.2 相关性检验 二元总体的相关系数 中心问题: 当样本个数n至少取到多少时,样本相关才能保证总体也相关? Ruben给出了总体相关系数的区间估计的近似逼近公式 设n为样本个数,r为样本相关系数, 根据 r 估计ρ ruben.test-function(n, r, alpha=0.05){ u-qnorm(1-alpha/2) r_star-r/sqrt(1-r^2) a-2*n-3-u^2; b-r_star*sqrt((2*n-3)*(2*n-5)) c-(2*n-5-u^2)*r_star^2-2*u^2 y1-(b-sqrt(b^2-a*c))/a y2-(b+sqrt(b^2-a*c))/a data.frame(n=n, r=r, conf=1-alpha, L=y1/sqrt(1+y1^2), U=y2/sqrt(1+y2^2)) } 调用 N=6,r=0.8时相关系数的区间估计 source(ruben.test.R) ruben.test(6,0.8) n r conf L U 1 6 0.8 0.95 -00.9727884 N=25,r=0.7时相关系数的区间估计 ruben.test(25,0.7) n r conf L U 1 25 0.7 0.95 0.4108176 0.8535657 总体的相关性检验 Pearson相关性检验 attach(ore) #使用例1的数据 cor.test(x,y) Pearsons product-moment correlation data: x and y t = 12.2984, df = 8, p-value = 1.778e-06 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.8926999 0.9941604 sample estimates: cor 0.9745586 二元变量间的相关分析 分析两个变量之间统计关系的强弱,它是直接使用同一样本两个观测系列观测值进行相关分析。如果两个变量都是连续测量的变量 ,则使用积差相关 , 即 Pearson 简单相关分析方法;如果两个变量是非连续性的离散的等级变量,或者虽然是连续变量,但是只想知道二者在等级上的相关性,则是等级相关,即Spearman相关或Kendall’s tau-b相关。 在相关系数显著性检验中 ,Pearson 相关显著性
文档评论(0)