SSS数据分析与挖掘实战案例精粹第四章.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 SPSS操作进阶;第四章 SPSS操作进阶;4.1.1项目背景;4.1.2分析思路;4.2.1开放题录入;4.2.2单选题录入;4.2.3多选题录入;4.2.3多选题录入-多重响应;;第一个受访者22岁,浏览器选了百度、360和其他。 第二个受访者33岁,浏览器选了谷歌和其他 ;实操:录入 二分类中代表每个选项的变量,在录入时应该保持一致 多重分类中代表每个答案的变量,在录入时应该保持一致 ;请问您目前已经拥有的数码产品有哪些?;请问你未来打算优先购买的数码产品有哪些?(最多选三项);4.3.1去除重复记录;在匹配组内的排序标准框中定义排序顺序,便于在查找出来的多条重复记录中指定主个案和重复个案。;; 基本个案指示符中基本个案用1表示,重复个案用0表示。 每组中最后一个个案为基本个案:同一重复数据组的最后一例是主要数据,其他是重复数据。 每组中的第一个个案为基本个案:同一重复数据组的第一例是主要数据,其他是重复数据。 根据指示符(新变量)的值进行筛选:0过滤,1保留; 连续计算每个组合中匹配个案(0=非匹配个案):同一重复数据组中包括基本个案和重复个案组内编号,0表示没有重复数据。 ;4.3.2发现异常值;4.3.3逻辑校验;?;4.4.1问卷加权;第二段:男女比例和受教育水平这两个因素可能对分析结果有较大的影响,会员中男女之比为6:4,教育水平是2:2:4:2,实际分布如下图,为了使问卷中的人口特征与实际相符,应该使问卷中数据赋予一定权重,让加权后的数据符合实际比例。;第一步:计算出问卷中男女及教育的比例;第二步:问卷中的比例*权重=实际比例;数据的横向合并——增加变量;“新的活动数据集”中的变量,是两个数据集中非共有的变量。 “已排除的变量”,是两个数据集中共有的变量。 “关键变量”两个数据集共有的,用来匹配对接的变量,可以从“已排除的变量”中导入。 “按照排序文件中的关键变量匹配个案”复选框 两个文件都提供个案:两个数据集个案合并; 非活动数据集为基于关键字的表:合并的数据文件的个案仅是当前活动集中的个案; 活动数据集为基于关键字的表:合并的数据文件的个案仅是当前非活动集中的个案;;合并后??数据,再指定加权权重即可;4.4.2业务分析;4.5 项目的总结与讨论;

文档评论(0)

iuad + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档