第六节 资料的基础分析).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2003年9月 第六章 数据的基础分析 本章的学习目标 一、数据资料的整理 问卷资料整理 数据类型 (一)问卷资料整理 ☆ 数据编辑是为了提高问卷数据的准确性而进行的再检查,目的是筛选出问卷中看不清楚、不完整、不一致或模棱两可的答案。 对不合格的问卷进行处理 返回现场工作 填补缺失值 有缺失值的问卷数很少 每份有缺失值的问卷中的缺失值所占的比例较小 有缺失值的变量不是关键变量 ☆丢弃不合格问卷 不合格的问卷比例较小 抽样数量很大时 不合格问卷与合格问卷没有明显的差别时 关键变量的缺失 不合格答案的比重较大 3、数据编码 数据编码是为每个问题的可能的答案分配一个代码,通常是一个数字。 ☆通常开放题和半开放题需要进行编码; ☆将所记录的答案归类整理,相同或相近意思的答案归为一类; ☆为每一类分配一个唯一代码。 单选题:答案只能有一个选项 例一 当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创 C没有 D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。 录入:录入选项对应值,如选C则录入3 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。 (1)方法一(二分法): 例二 贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示 考虑在内。 A月薪员工 B日薪员工 C钟点工 编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。 录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。 方法二: 例三 你认为开展保持党员先进性教育活动的最重要的目标是那三项: 1( ) 2 ( ) 3( ) A、提高党员素质 B、加强基层组织 C、坚持发扬民主 D、激发创业热情 E、服务人民群众 F、促进各项工作 编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2” B,“3” C,“4” D,“5” E,“6” F 录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。 注:能用方法二编码的多选题也能用方法一编码,但是项数不定的多选只能用二分法,即方法一是多选题一般处理方法。 排序题: 对选项重要性进行排序 例四 您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列) 第一位 第二位 第三位 第四位 第五位 编码:定义五个变量,分别可以代表第一位 第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格 录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。 开放性文字题: 如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。 4、数据录入 将调查问卷中的信息录入计算机内,形成数据文件以供统计分析之用。 ☆通常情况下,调研公司都是将数据录入两遍,然后作检验,来控制录入的错误; ☆如果时间和经费有限,加上数据输入人员错误率很低时,只核实25%—50%的数据就可以了。 5、数据清理 数据清理包括检查数据一致性和缺失值 ☆数据一致性检查是为了找出超出正常范围、逻辑上不合理或者极端的取值; ☆缺失值就是对某个变量的取值不明,原因可能是调查对象的答案不清楚或者记录不完整。 中性值代替 用估计值代替 整列删除 结对删除 (二)数据的类型 假如你已经获得了所要的全部数据; 认识数据的第一步:你得到的是什么类型的数据? 利用图和表来展示数据中的信息; 运用指标刻画数据的某些特征和程度; 使用SPSS来完成对数据的描述。 数据变量的分类 1、按照取值类型:品质数据和数量数据; 2、按照测量水平:定类(Nominal)、定序(Ordinal)、定距(Interval)、定比(Ratio)等四类; 3、按照获取时间:截面数据、时间序列; 不同类型的数据应使用不同的统计方法 变量类型与数据等级 定类变量——名称级数据(名义数据):取值只代表观测对象的不同类别,例如“性别”、“ 职业”等变量。 定序变量——顺序级数据:取值的大小能够表示观测对象的某种顺序关系,例如“最高学历”等变量。 定矩变量——间隔级数据:取值之间可以比较大小,可以用加减法计算差异的大小,例如“年龄”等变量。 定比变量——比例级数据:与定矩变量意 义相近。“0”值

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档