第3章数据的预处理答题.ppt

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据选取的应用举例 利用居民储蓄调查数据,根据不同的分析要求采用不同的数据选取方法抽样: (1)如果只希望分析城镇储户的情况,可以通过数据选择功能采用指定条件的抽样方法进行抽样; (2)如果只希望对其中的70%的数据进行分析,可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。 练习 单变量值分组应用举例: 1、利用职工情况数据按职工的基本工资升序进行分组。 2、按职工的职称升序进行分组。 加权处理 统计分析中的加权处理是极为常见的,如计算加权平均数等。 例如,希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理,还应考虑到销售量对平均价格的影响。因此,以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数,就能够较准确地反应平均价格水平。 数据拆分 SPSS的数据拆分与数据排序很相似,但有一个重要的不同点,即数据拆分不仅是按指定变量进行简单排序,更重要的是根据变量对数据进行分组,为以后的分组统计分析提供便利。 说明: (1)数据拆分将对后面的分析一直起作用,即无论进行哪种统计分析,都将按拆分变量的不同组别分别分析计算。如果希望对所有数据进行整体分析,则需要重新执行数据拆分,在数据拆分窗口中选择分析所有个案,不创建组项。 (2)对数据可以进行多重拆分,类似于数据的多重排序。多重拆分的次序决定于选择拆分变量的前后次序。 数据拆分应用举例: 利用职工情况数据选择职称和(或)性别变量进行数据拆分并进行计算各组的基本工资。 基本操作菜单转换 自动重新编码 以职工数据.sav为例 将分组变量基本工资(sr)选择到右边的框中 在新名称后输入存放分组结果的变量名 在重新编码的起点中选择是最低值进行还是最高值进行 最低值表示升序,最高值表示降序 组距分组 组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在连续变量或变量值较多的情况下适用。 分组关键 分组数目的确定 组距的确定 指定分组变量 定义分组区间 指定存放分组结果的变量 SPSS分组操作应注意: 基本操作一:菜单转换 重新编码为相同变量 以职工数据.sav为例 把分组变量基本工资(sr)选到数字变量中 单击旧值和新值得到 定义分组区间 先指定区间范围,再在“值”中添加对应的分组值 基本操作二、菜单转换 重新编码为不同变量 将分组变量基本工资(sr)选入数字变量 定义输出变量 先指定区间范围,再在“值”中添加对应的分组值 练习 根据数据文件2-2 2003-2015年某企业净利润与员工总数.sav,将“员工总数”按照以下方式分组: 15.4 2 351以上 15.4 2 301~350 15.4 2 251~300 53.8 7 201~250 频率(%) 频数(人) 员工总数 第七节 数据预处理的其他功能 数据转置 加权处理 数据拆分 数据转置(行列互换) 以年人均消费支出和教育.Sav为例 把变量和名称变量分别选入对应位置 标记变量 以数据加工(职工数据).sav为例 比较组:表示将分组统计结果输出在同一表格中,以便于不同组之间的比较; 按组组织输出:表示将分组统计结果分别输出在不同的表格中。 通常选择第一种输出方式。 随机抽样 基于时间或个案全距 通过过滤变量选取样本 第四节 计数 SPSS计数是指对所有个案或满足其条件的部分个案,计算若干个变量中有几个变量的值落在特定的区间内,并将计数结果存入一个新变量中的过程。 关键步骤 指定哪些变量参与计数,计数的结果存入哪个变量中。 指定计数区间 单个变量值 系统缺失值 系统缺失值或用户缺失值 给定最大值和最小值的区间 小于等于某指定值的区间 大于等于某指定值的区间 计数区间 计数的基本操作 以居民储蓄调查数据(存款).sav为例 菜单转换 对个案内的值计数 我们认为如果储户收入今年比去年增加了,且认为今后收入仍会增加则认为收入状况较好。试分析有多少个储户的收入状况较好。 以学生成绩.sav为例 对两门课中成绩在优良以上 (分数大于等于80分)的计数 第五节 分类汇总 分类汇总是按照某分类进行的汇总计算。 按照哪个变量进行分类 对哪个变量进行汇总,并指定对哪些统计量进行计算 SPSS实现分类汇总需要明确: 分

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档