- 32
- 0
- 约3.59千字
- 约 11页
- 2021-07-18 发布于安徽
- 举报
. .
. -可修编.
R语言实验指导书〔二〕
2016年10月27日
实验三 创立和使用R语言数据集
实验目的:
了解R语言中的数据构造。
熟练掌握他们的创立方法,和函数中一些参数的使用。
对创立的数据构造进展,排序、查找、删除等简单的操作。
实验容:
向量的创立及因子的创立和查看
有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1 以 及他们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。
将这些州名以字符串的形式保存在state当中。
创立一个为这个向量创立一个因子statef。
使用levels函数查看因子的水平。
矩阵与数组。
创立一个4*5的数组如图,创立一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。
将之前的state,数组,矩阵合在一起创立一个长度为3的列表。
创立一个数据框如图。
将这个数据框按照mpg列进展排序。
访问数据框中drat列值为3.90的数据。
实验要求
要求学生熟练掌握向量、矩阵、数据框、列表、因子的创立和使用。
实验四 数据的导入导出
实验目的
熟练掌握从一些包中读取数据。
熟练掌握csv文件的导入。
创立一个数据框,并导出为csv格式。
实验容
创立一个csv文件〔容自定〕,并用readtable函数导入该文件。
查看R语言自带的数据集airquality〔纽约1973年5-9月每日空气质量〕。
列出airquality的前十列,并将这前十列保存到air中。
查看airquality中列的对象类型。
查看airquality数据集中各成分的名称
将air这个数据框导出为csv格式文件。〔write.table (x, file =, sep =, row.names =TRUE, col.names =TRUE, quote =TRUE)〕
实验要求
要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。
实验五 R语言数据的清洗
实验目的
查看数据集的缺失值,并学会对缺失值进展处理。
对异常变量重新赋值。
将某一列的字符型转化为日期型。
利用subset〔〕获取子集。
实验容
有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。
Ozone - c(41, 36, 12, 18, NA, 28)
Solar.R - c(190, 118, 149, 313, NA, NA)
wind - c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9)
Temp - c(67, 82, 74, 62, 86, 66)
date - c(1997/05/01,1997/05/02,1997/05/03,1997/05/04,1997/05/05,1997/05/06)
air - data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFactors = FALSE)
使用class〔〕函数查看date函数的类型,并将其转化为data型,格式为月/日/年。
使用subset〔〕根据Temp列获取air中Temp大于60小于70的数据。
将air中含有缺失值的列去掉。
找出Temp于85的值将其设置为缺失值。
创立一个air1包含两个列q1,q2。用cbind函数添加到air中。
使用names函数查看air的列名,并根据列自己创立一个数据框。使用rbind函数添加到air中
实验要求
要求学生会用subset获取子集,学会对缺失值进展一些简单的处理和对一些异常值的查找和修改。
实验六 高级数据管理
实验目的
学会简单的数值和字符处理函数。
学会自己编写一个函数。
实验容
使用下面代码创立roster数据集。
Student - c(John Davis, Angela Williams,
Bullwinkle Moose, David Jones,
Janice Markhammer, Cheryl Cushing,
Reuven Ytzrhak, Greg Knox, Joel England,
Mary Rayburn)
Math - c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522)
Science - c(95, 99, 80,
原创力文档

文档评论(0)