- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析 数统学院 应统张腾飞 20150613027 主要内容 一、数据说明 二、聚类方法 三、聚类结果 四、结论感想 数据的选取 从西南证券里找到的中证100指数9月1日到2月26日的收盘价数据。利用R计算数据的均值协方差和相关系数,程序如右图所示: 为了方便演示,我们选择前三个变量的前12个样本利用程序进行皮尔逊相关性检验: C1=C[1:12,1:3] write.table(C1,file =C1.txt) colMeans(C1) cov(C1) cor(C1) cor.test(~平安银行+万科A, data=C1) cor.test(~平安银行+中兴通讯, data=C1) cor.test(~万科A+中兴通讯, data=C1) 得出结果如下: 结果分析 根据结果我们可以看出平安银行和万科A是相关的 平安银行和中兴通讯是不相关的 万科A和中兴通讯是相关的 从西南证券里找到的能源互联指数版块2月26日的数据 D=read.csv(ncsv,header=F) outline-function(x, txt=TRUE){if (is.data.frame(x)==TRUE)#轮廓图 x-as.matrix(x);m-nrow(x); n-ncol(x) plot(c(1,n), c(min(x),max(x)), type=n, main=The outline graph of Data,xlab=Number,ylab=Value) for(i in 1:m){lines(x[i,], col=i) if (txt==TRUE){k-dimnames(x)[[1]][i] text(1+(i-1)%%n, x[i,1+(i-1)%%n], k)}}} outline(D) 利用程序得到轮廓图 stars(D)#星图 windows() stars(D,full=FALSE, draw.segments = TRUE,key.loc = c(5,0.5), mar = c(2,0,0,0))#半幅星图 #脸谱图 D=read.csv(ncsv,header=F) library(aplpack) windows() faces(D) #调和曲线图 unison-function(x){ if (is.data.frame(x)==TRUE) x-as.matrix(x); t-seq(-pi, pi, pi/30); m-nrow(x); n-ncol(x); f-array(0, c(m,length(t))) for(i in 1:m){f[i,]-x[i,1]/sqrt(2) for( j in 2:n){ if (j%%2==0) f[i,]-f[i,]+x[i,j]*sin(j/2*t) else f[i,]-f[i,]+x[i,j]*cos(j%/%2*t) } } plot(c(-pi,pi), c(min(f),max(f)), type=n, main=The Unison graph of Data, xlab=t, ylab=f(t)) for(i in 1:m) lines(t, f[i,] , col=i)} windows() unison(D) 得到星图 得到调和曲线图 聚类分析问题 同样利用中证100指数数据在欧式距离下分别利用最长距离法、类平均法、重心法、离差平方和法对100支股票进行聚类。 利用R程序如下: read.csv(zz100.csv,header=F)-DA d-dist(DA) hc1-hclust(d, centroid) hc2-hclust(d, complete) hc3-hclust(d, average) hc4-hclust(d, ward.D) opar - par(mfrow = c(2, 2)) plot(hc1,hang=-1); plot(hc2,hang=-1) plot(hc3,hang=-1); plot(hc4,hang=-1) par(opar) km-kmeans(d,3,nstart=100);km sort(km$cluster) 四中种聚类方法结果如下:
您可能关注的文档
最近下载
- 广州数控GSK980TDi系列操作使用手册.pdf
- 湘教版科学小学四年级上册期末检测试题(含答案).doc VIP
- 高中英语应用文写作 观点议论类 2025高考必备 精准应对命题趋势的超强课件(共五)(41张PPT)(内嵌视频+音频).pptx VIP
- 沥青混合料性能-用环境-路面损害的基本关系.ppt VIP
- 自建房安全专项整治工作实施方案.docx VIP
- 八年级劳动素养测试.docx VIP
- 2025年公职律师培训试题.doc VIP
- 某中型制造业采购部经理岗位KPI绩效考核指标.docx VIP
- 预制装配式地铁车站施工难点及应对措施.docx VIP
- 2025湘艺版音乐八年级上册 《小背篓》课件.pptx
原创力文档


文档评论(0)