R语言笔记.docx

下载文档 降价啦

10
0
约1.1万字
约 16页
2017-06-10 发布于湖北
举报
版权申诉
保障服务

R语言笔记.docx

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

R语言笔记

R语言学习笔记常用函数1、聚类常用的包： fpc，cluster，pvclust，mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust, agnes, diana基于模型的方法: mclust基于密度的方法: dbscan基于画图的方法: plotcluster, plot.hclust基于验证的方法: cluster.stats2、分类常用的包rpart，party，randomForest，rpartOrdinal，tree，marginTree，maptree，survival决策树: rpart, ctree随机森林: cforest, randomForest回归, Logistic回归, Poisson回归: glm, predict, residuals生存分析: survfit, survdiff, coxph3、关联规则与频繁项集常用的包arules：支持挖掘频繁项集，最大频繁项集，频繁闭项目集和关联规则DRM：回归和分类数据的重复关联模型APRIORI算法，广度RST算法：apriori, drmECLAT算法：采用等价类，RST深度搜索和集合的交集： eclat4、序列模式常用的包： arulesSequencesSPADE算法： cSPADE5、时间序列常用的包： timsac时间序列构建函数： ts成分分解: decomp, decompose, stl, tsr6、统计常用的包： Base R, nlme方差分析: aov, anova密度分析: density假设检验: ?t.test, prop.test, anova, aov线性混合模型：lme主成分分析和因子分析：princomp7、图表条形图: barplot饼图: pie散点图: dotchart直方图: hist密度图: densityplot蜡烛图, 箱形图 boxplotQQ (quantile-quantile) 图: qqnorm, qqplot, qqlineBi-variate plot: coplot树: rpartParallel coordinates: parallel, paracoor, parcoord热图, contour: contour, filled.contour其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png8、数据操作缺失值：na.omit变量标准化：scale变量转置：t抽样：sample堆栈：stack, unstack其他：aggregate, merge, reshape9、与数据挖掘软件Weka做接口RWeka: 通过这个接口，可以在R中使用Weka的所有算法。安装程序包1 用函数 install.packages()2 安装本地zip包路径：Packagesinstall packages from local files查看安装的包installed.packages()检查更新old.packages()更新update.packages()帮助查看帮助文档?install.package() help(“install.package”)函数帮助?functionhelp(‘function’)html帮助Help.start()帮助Html帮助关键词搜索RSiteSearch(‘word’)数据类型向量创建向量c( ),创建向量length( ), 向量长度删除向量vector[-n]，即删除第n个向量mode( ), 向量类型rbind( ), 向量元素都作为一行rowcbind( ) ，向量元素都作为一列col*创建向量序列seq(from, to, by = ((to - from)/(length.out - 1)),length...),length是总长度（个数），因此by就是间隔rep(mode,time) 产生mode 重复time次的向量letters[n:m] 产生字符向量rnorm(n,mean=…,sd=…) 随机序列取子集值范围限制如：V(xm|xn)索引坐标限制如：V[c()]，V[1:3]创建向量空间V=vector()创建向量空间后就可以对向量元素进行赋值常用计算函数mean(x ), sum( x), min( x), max( x), var( x), 方差sd( x), 标准差cov(x),协方差cor(x),相关度pro