R-4因子、列表、数据框及输入输出.pptVIP

  • 1
  • 0
  • 约1.1万字
  • 约 39页
  • 2017-07-27 发布于四川
  • 举报
R-4因子、列表、数据框及输入输出

因子(factor)和有序因子 统计中的变量重要类别 连续: 区间变量 离散: 名义变量、有序变量 区间变量取连续的数值,可以求和、算平均等。 名义变量和有序变量取离散值,既可用数值表示也可取字符型值,其具体数值没有数量意义,不能用于加减乘除计算而只能用来分类或者计数。名义变量比如性别、省份、职业,有序变量比如班级名次、质量等级等。 因为离散变量有各种不同表示方法,在R中为统一起见使用因子(factor)来表示这种分类变量。还提供了有序因子(ordered factor)来表示有序变量。 因子是一种特殊的字符型向量,其中每一个元素取一组离散值中的一个,而因子对象有一个特殊属性levels表示这组离散值(用字符串表示)。例如: x - c(男, 女, 男, 男, 女) y - factor(x) y [1] 男 女 男 男 女 Levels: 男 女 可以自行指定各离散取值水平(levels),不指定时由x的不同值来求得。 labels可以用来指定各水平的标签,不指定时用各离散取值的对应字符串。 exclude参数用来指定要转换为缺失值(NA)的元素值集合。如果指定了levels,则因子的第i个元素当它等于水平中第j个时元素值取“j”,如果它的值没有出现在levels中则对应因子元素值取NA。 o

文档评论(0)

1亿VIP精品文档

相关文档