- 229
- 0
- 约1.38万字
- 约 95页
- 2018-07-22 发布于江苏
- 举报
用R软件做聚类分析地例子
应用统计分析实验 —— R软件 SPSS:这是一个很受欢迎的统计软件 容易操作, 输出漂亮, 功能齐全, 价格合理。 对于非统计工作者是很好的选择。 SAS:这是功能非常齐全的软件; 美国政府政策倾斜(“权威性”) 许多美国公司使用。 价格不菲,每年交费.即使赠送,条件苛刻 尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。 R软件:免费的,志愿者管理的软件。 编程方便,语言灵活,图形功能强大 有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包. 这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。 对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。 Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。 Eviews:这是一个主要处理回归和时间序列的软件。 GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。 MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。但是统计方法不多。 R的历史 S语言在1980年代后期在ATT实验室开发. R 项目由Auckland 大学统计系的Robert Gentleman和Ross Ihaka于1995年开始的. 它很快得到广泛用户的欢迎. 目前它是由R核心发展团队维持;它是一个由志愿者组成的工作努力的国际团队 基本语法 向量 列表和数据框 读写数据文件 控制语句控制语句与自定义函数 自定义函数 统计量 数据中心化与标准化 数据的图形表示 x=seq(-10,10,2); y=rnorm(11) plot(x, y) plot(x, y,main=散点图,xlab=横坐标x,ylab=纵坐标y) text(x,y, 1:length(x),-1) # 写入点序号,第三个参数默认如此 plot(x,y,type = o, col = red,pch=2,lty=3) Bayes判别 五.聚类分析 系统聚类 快速聚类 实验三:回归分析中的自变量的挑选 四.判别分析 距离判别 Bayes判别 fisher判别 #计算马氏距离 mahalanobis(x, center, cov, inverted=FALSE, ...) 距离判别 某总体的中心即均值向量 某总体的协方差阵 若设为TRUE,表明cov已求逆。默认为False dda1=function(x,newx=NULL) #x 为训练样本,最后一列为类别, newx为待判样本 { x=as.matrix(x); p=ncol(x)-1; #变量个数 k=max(x[,p+1]); #类别个数 n=nrow(x); #已知数据的个数 if(is.null(newx)||ncol(newx)!=p) newx=x[,1:p] #如果待判样本newX为空,则为训练样本 m=nrow(newx); #待判数据的个数 md=matrix(-1,m,k); #距离矩阵k列,分别为到k个总体的距离 colnames(md)=paste(Dis,1:k,sep=); newClass=rep(-1,m); #新的类别 cov_each=matrix(0,nrow=p,ncol=p) ; for(i in 1:k){ temp=x[x[,p+1]==i,1:p]; center=apply(temp,2,mean); #计算当前总体的中心 cov_each=cov(temp) md[,i]=mahalanobis(newx,center,cov_each);# 计算待判样本到当前总体的马氏距离 } newClass=apply(md,1,which.min); #距离矩阵md每一行最小的列就是归属类 list(matrix_Distance=md,newClass=newClass) } 假设各总体协方差阵不相等时的距离判别 例1 湿度差 压温差 q 1 -1.9 3.2 1 2 -6.9 10.4 1 3 5.2 2.0 1 4 5.0 2.5 1 5 7.3 0.0 1 6 6.8 12.7 1 7 0.9 -15.4 1 8 -12.5 -2.5 1 9 1.5 1.3 1 10
您可能关注的文档
- 生产与运作管理期末复习指导3.doc
- 生产企业出口退税系统操作手册6.doc
- 生产企业参与PC套期保值操作策略.doc
- 生产加工型小企业安全生产评估细则3.doc
- 生产区长全生产责任制3.doc
- 生产和经营复习题.ppt
- 生产和运作管理讲义第章.ppt
- 生产和运作管理教材.ppt
- 生产场所危险等级划分4.doc
- 生产安全事故应预案备案流程图.doc
- (正式版)DB51∕T 1867-2014 《袋栽黑木耳生产技术规程》.docx
- (正式版)DB51∕T 2413-2023 《油橄榄密植丰产栽培技术规程》.docx
- (正式版)DB51∕T 2436-2017 《川菜东坡一品肉烹饪工艺技术规范》.docx
- (正式版)DB51∕T 2396-2017 《农村电子商务服务站(点)服务与管理规范》.docx
- (正式版)DB51∕T 2419-2017 《桢楠扦插育苗技术规程》.docx
- CN105145773B 一种无花果曲奇饼干及其制作方法 (江苏农林职业技术学院).docx
- CN105203825A 微测量电极的制作方法和热电势的测量方法及相关装置 (国家纳米科学中心).docx
- CN105137533B 一种啁啾光纤光栅及其制作方法 (南京航空航天大学).docx
- (正式版)DB51∕T 2453-2018 《巴山新居公共管理指南》.docx
- (正式版)DB51∕T 1892-2014 《川西北地区沙化土地治理技术规程》.docx
原创力文档

文档评论(0)