- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
......word...专业技术行业资料......
......范文范例学习参考指导.......
R语言实验指导书(二)
2016年10月27日
实验三 创建和使用R语言数据集
实验目的:
了解R语言中的数据结构。
熟练掌握他们的创建方法,和函数中一些参数的使用。
对创建的数据结构进行,排序、查找、删除等简单的操作。
实验内容:
向量的创建及因子的创建和查看
有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1 以 及他们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。
将这些州名以字符串的形式保存在state当中。
创建一个为这个向量创建一个因子statef。
使用levels函数查看因子的水平。
矩阵与数组。
创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。
将之前的state,数组,矩阵合在一起创建一个长度为3的列表。
创建一个数据框如图。
将这个数据框按照mpg列进行排序。
访问数据框中drat列值为3.90的数据。
实验要求
要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用。
实验四 数据的导入导出
实验目的
熟练掌握从一些包中读取数据。
熟练掌握csv文件的导入。
创建一个数据框,并导出为csv格式。
实验内容
创建一个csv文件(内容自定),并用readtable函数导入该文件。
查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。
列出airquality的前十列,并将这前十列保存到air中。
查看airquality中列的对象类型。
查看airquality数据集中各成分的名称
将air这个数据框导出为csv格式文件。(write.table (x, file =, sep =, row.names =TRUE, col.names =TRUE, quote =TRUE))
实验要求
要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。
实验五 R语言数据的清洗
实验目的
查看数据集的缺失值,并学会对缺失值进行处理。
对异常变量重新赋值。
将某一列的字符型转化为日期型。
利用subset()获取子集。
实验内容
有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。
Ozone - c(41, 36, 12, 18, NA, 28)
Solar.R - c(190, 118, 149, 313, NA, NA)
wind - c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9)
Temp - c(67, 82, 74, 62, 86, 66)
date - c(1997/05/01,1997/05/02,1997/05/03,1997/05/04,1997/05/05,1997/05/06
air - data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFactors = FALSE)
使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/年。
使用subset()根据Temp列获取air中Temp大于60小于70的数据。
将air中含有缺失值的列去掉。
找出Temp中大于85的值将其设置为缺失值。
创建一个air1包含两个列q1,q2。用cbind函数添加到air中。
使用names函数查看air的列名,并根据列自己创建一个数据框。使用rbind函数添加到air中
实验要求
要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。
实验六 高级数据管理
实验目的
学会简单的数值和字符处理函数。
学会自己编写一个函数。
实验内容
使用下面代码创建roster数据集。
Student - c(John Davis, Angela Williams,
Bullwinkle Moose, David Jones,
Janice Markhammer, Cheryl Cushing,
Reuven Ytzrhak, Greg Knox, Joel England,
Mary Rayburn)
Math - c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522)
Science - c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86)
English - c(2
原创力文档


文档评论(0)