R语言简介资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R语言简介资料

* * * 图9 分步绘图 1 2 3 4 5 6 * 一页多图 图10 一页多图 par() par(mfrow=c(2,2) ... * 在原有图形上添加元素 举例: x - rnorm(100) # 生成随机数 hist(x,freq=F) # 绘制直方图 curve(dnorm(x),add=T) # 添加曲线 h - hist(x, plot=F) # 绘制直方图 ylim - range(0, h$density, dnorm(0)) #设定纵轴的取值范围 hist(x, freq=F, ylim=ylim) #绘制直方图 curve(dnorm(x),add=T,col=red) #添加曲线 * 图10 在原有直方图上添加曲线 * * 编程基础 R可以灵活的编写程序,用户自己编写的程序可以直接调用。编程时无需声明变量的类型,这与C,C++等语言不同。 基本格式 函数名 - function(数据,参数1= 默认值,…) { 异常处理; 表达式(循环/判别); return(返回值); } 函数内部也可用#添加注释 * 程序流程控制 if if(条件) 表达式 if(条件) 表达式1 else 表达式2 举例 p = 0.03 { if(p=0.05) print(p = 0.05!) else print(p 0.05!) } * 循环 for, while for(变量 in 向量) 表达式 用法: for(i in 1:10) print(i) while(条件) 表达式 用法: i - 1 while(i10){ print(i); i - i + 1} * 返回值 返回值表示函数输出的结果。 返回值必须是一个对象。 R默认将最后一行作为返回值。 如果函数的结果需要有多个返回值,可以创建一个list(),并返回该对象。 也可以用return()函数,设定返回值。 但是一个函数的返回的对象只有一个。 * 异常处理 如数据输入不能满足要求,或者参数设定错误等等,可能造成函数给出错误的结果,则需要对函数的运行过程发出警告或终止,以提高程序的稳健性。 警告的写法 if(any(is.na(inputdata))) inputdata - na.omit(inputdata) cat(“NAs are found in the input data, and has been removed.\n) 终止的写法 if(any(is.na(xx))) stop(NAs are not allowed!\n) * 函数举例 问题:输入直角三角形的两个边长,求其斜边长。 定义函数: rcal - function(x,y){ z - x^2 + y^2 result - sqrt(z) return(result) } 调用函数: rcal(3,4) 结果: * 问题描述与目标 某些高浓度的有害藻类对河流生态环境的强大破坏是一个严重的问题,它不仅破坏河流的生物,也破坏水质。 构建一个可以基于化学兴致来准确预测藻类的模型将有助于监理检测有害藻类的廉价的自动化系统。 更好地了解影响藻类频率的因素。 * 数据导入 使用R程序包DMwR中的数据,其中有一个名为algae和algae.sols的数据框,分别为200个样本和140个测试集 使用library(DMwR) head(algae)显示数据框的前6行 * 每条记录由11个变量组成:季节、河流大小、河水速度、最大pH值、最小含氧量、平均氯化物含量、平均硝酸盐含量、平均氨含量、平均正磷酸盐含量、平均磷酸盐含量、平均叶绿素含量 数据可视化和摘要 获得每个变量的统计摘要 summary(algae) * 数据可视化和摘要 获得每个变量的统计摘要 describe(algae) * 数据可视化和摘要 通过可视化了解各个变量的数据分布情况 使用直方图和Q-Q图了解MxPH的数据分布情况 * 数据可视化和摘要 通过可视化了解各个变量的数据分布情况 使用箱图绘制oPO4的数据分布情况 * 数据可视化和摘要 通过可视化了解各个变量的数据分布情况 使用条件绘图指令绘制河流大小与海藻a1条件分位箱线图,了解两者之间的关系: * 数据可视化和摘要 通过可视化了解各个变量的数据分布情况 使用条件绘图指令绘制season、mnO2与海藻a3关系分布图,了解a3与两者之间的关系: * 缺失值处理 剔除缺失值较多的记录 data(algae) manyNAs(algae,0.3)

文档评论(0)

LOVE爱 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5341224344000002

1亿VIP精品文档

相关文档