2015第章数据的预处理.pptVIP

  • 2
  • 0
  • 约1.58万字
  • 约 62页
  • 2016-12-16 发布于北京
  • 举报
第三章 SPSS数据的预处理 为什么要进行数据的预处理 在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。 数据的预加工处理服务于数据分析和建模,主要包括以下几个问题: 1、缺失值和异常数据的处理; 2、数据的转换处理; 3、数据抽样; 4、选取变量。 预处理的内容 数据的排序 变量计算 数据选取 计数 分类汇总 数据分组 数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。 3.1 数据的排序 SPSS的数据排序是将数据编辑窗口中的数据按照某个或多个指定变量的变量值升序或降序重新排列。这里的变量也称为排序变量。排序变量只有一个时,排序称为单值排序。排序变量有多个时,排序称为多重排序。多重排序中,第一个指定的排序变量称为主排序变量,其他依次指定的变量分别称为第二排序变量、第三排序变量等。 3.1.1 数据排序的目的 数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等; 通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度; 通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。 3.1.2 数据排序的基本操作 SP

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档