R语言笔记.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言笔记

R语言学习笔记常用函数1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust, agnes, diana基于模型的方法: mclust基于密度的方法: dbscan基于画图的方法: plotcluster, plot.hclust基于验证的方法: cluster.stats2、分类常用的包rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,survival决策树: rpart, ctree随机森林: cforest, randomForest回归, Logistic回归, Poisson回归: glm, predict, residuals生存分析: survfit, survdiff, coxph3、关联规则与频繁项集常用的包arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则DRM:回归和分类数据的重复关联模型APRIORI算法,广度RST算法:apriori, drmECLAT算法:采用等价类,RST深度搜索和集合的交集: eclat4、序列模式常用的包: arulesSequencesSPADE算法: cSPADE5、时间序列常用的包: timsac时间序列构建函数: ts成分分解: decomp, decompose, stl, tsr6、统计常用的包: Base R, nlme方差分析: aov, anova密度分析: density假设检验: ?t.test, prop.test, anova, aov线性混合模型:lme主成分分析和因子分析:princomp7、图表条形图: barplot饼图: pie散点图: dotchart直方图: hist密度图: densityplot蜡烛图, 箱形图 boxplotQQ (quantile-quantile) 图: qqnorm, qqplot, qqlineBi-variate plot: coplot树: rpartParallel coordinates: parallel, paracoor, parcoord热图, contour: contour, filled.contour其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png8、数据操作缺失值:na.omit变量标准化:scale变量转置:t抽样:sample堆栈:stack, unstack其他:aggregate, merge, reshape9、与数据挖掘软件Weka做接口RWeka: 通过这个接口,可以在R中使用Weka的所有算法。安装程序包1 用函数 install.packages()2 安装本地zip包路径:Packagesinstall packages from local files查看安装的包installed.packages()检查更新old.packages()更新update.packages()帮助查看帮助文档?install.package() help(“install.package”)函数帮助?functionhelp(‘function’)html帮助Help.start()帮助Html帮助关键词搜索RSiteSearch(‘word’)数据类型向量创建向量c( ),创建向量length( ), 向量长度删除向量vector[-n],即删除第n个向量mode( ), 向量类型rbind( ), 向量元素都作为一行rowcbind( ) ,向量元素都作为一列col*创建向量序列seq(from, to, by = ((to - from)/(length.out - 1)),length...),length是总长度(个数),因此by就是间隔rep(mode,time) 产生mode 重复time次的向量letters[n:m] 产生字符向量rnorm(n,mean=…,sd=…) 随机序列取子集值范围限制如:V(xm|xn)索引坐标限制如:V[c()],V[1:3]创建向量空间V=vector()创建向量空间后就可以对向量元素进行赋值常用计算函数mean(x ), sum( x), min( x), max( x), var( x), 方差sd( x), 标准差cov(x),协方差cor(x),相关度pro

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档