5 Clementine样本的管理.pptVIP

  • 29
  • 0
  • 约5.26千字
  • 约 41页
  • 2017-05-22 发布于上海
  • 举报
5 Clementine样本的管理

第4章 Clementine样本的管理 第4章 Clementine样本的管理 样本管理主要针对样本,实现样本的排序、条件筛选、抽样、浓缩、分类汇总、平衡处理以及数据转置和重新组织等。 样本管理的节点工具放置在节点工具箱的记录选项卡中,还有一些相关节点放置在字段选项卡中。 4.1 样本的排序 通过将样本数据按某个或某几个变量值的升序或降序重新排列,不仅便于浏览数据,而且还能够帮助发现数据可能存在的异常值。 异常值往往是极大值或极小值 通过记录选项卡中的排序节点实现样本排序。 下面以高中学生某学期期末各科考试成绩数据ReportCard.xls为例,说明排序的具体操作。 操作目标:分性别将总成绩按降序排序。 4.1 样本的排序 建立Excel节点读入ReportCard.xls数据 建立导出节点计算总成绩; 选择记录选项卡中的排序节点并将其连接到数据流的相应位置上,其参数设置窗口如图所示。 4.1 样本的排序 在字段列选择排序变量,在顺序列指定升序或降序 这里首先选择性别,指定按升序排序;再选择总成绩,指定在性别相同的情况下按降序排序。 4.2 样本的条件筛选 分析有时只针对某类特征的样本进行,这时要首先给出条件,将满足条件的样本筛选出来。通过记录选项卡中的选择节点实现样本的筛选。 这里仍以高中学生某学期期末各科考试成绩数据ReportCard.xls为例,说明样本筛选的具

文档评论(0)

1亿VIP精品文档

相关文档