第3章数据的预处理new.pptVIP

  • 95
  • 0
  • 约6.51千字
  • 约 57页
  • 2016-12-29 发布于重庆
  • 举报
例: 以“大学生职业生涯.sav”为例,分析不同专业类别学生对本专业和未来职业的喜爱及了解程度。 即对专业和职业认知得分按专业类别分类计算平均得分。 例: 以“职工数据.sav”为例,分析男性和女性的入职薪水平均值是否有较大差距,目前薪水的平均值是否有较大差距。 男性和女性职工的平均入职起薪和平均目前薪水存在较大的差距,尽管平均教育水平差距不大。 3.8 数据分组 数据分组:是根据统计分析的需要,将数据按照某种标准重新划分为不同的组别。 数据分组的目的: 数据分组是对数值型数据进行整理和粗略把握数据分布的重要工具,在数据分组的基础上进行的频数分析,更能够概括和体现数据的分布特征。 分组还能够实现数据的离散化处理等。 组距分组的两个问题: 分组数目K的确定 影响因素:数据本身特点、数据个数 组数的确定应以能够清楚地显示数据分布特征和规律为原则 经验公式 :K=1+ln(n)/ln(2) (四舍五入取整) 组距的确定 组距=(最大值-最小值)/组数 =全距/组数 在定义分组区间时应注意遵循“不重不漏”的原则。“不重”是指一个变量值只能分在某一个组中,不能在其他组中重复出现;“不漏”是指所有数据都应分配在某个组中,不能遗漏。 数据的分组 操作: [Transform] →[Recode] → [Into Same Variables]或者[Into Differ

文档评论(0)

1亿VIP精品文档

相关文档