第八章数据整理分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章数据整理分析

第八章 资料的整理与分析 资料整理包括: 编辑—检查和修正搜集到的资料; 编码—为每个问题的答案配上数字或符号,为列表和统计分析作准备; 列表—把调查资料用表格的形式展现出来。 第一节 资料的整理 一、编辑 (一)实地编辑 在数据收集现场,问卷实施后尽快进行,由现场主管进行检查。重点是复查和追访。 检查问卷的完整性、清楚性、内容的一致性、明确性。 因调查刚刚完成,资料收集人员对问题记忆清晰,可补充遗漏,辨别字体模糊之处,明确指代对象,甚至可以追访被调查者,弄清问题。 第一节 资料的整理 (二)办公室编辑 由经验丰富的审核员进行,主要工作是对以下问题处理上。 不完整答案的对策—废卷、空白处为不详值 明显错误答案的对策—修正、不详值 无兴趣答案的对策——废卷、不详值 纠正对开放性问题打乱顺序的回答 二、编码 (一)定义 编码就是对一个问题的不同回答进行分组和确定数字代码的过程。 预编码 事后编码 事后编码 对开放式问题的回答进行编码需要采用以下四个步骤: 1、列出答案。即所有答案都一一列出。 2、合并答案。对本质上一致的答案进行归类。 3、设置编码。对每个类别分配数字编码。 4、输入编码。 找出与步骤2得到的合并类别相符的回答。 读取每组问题中每个开放式问题的回答。 在调查表的适当地方,注明每个问题回答的数字编码。 编码明细单 编码明细单是一份说明问卷中各个问题及其答案,与计算机数据文件中的字段、数码位数及数码之间一一对应关系的文件。 见下表:编码明细单 编码明细单编制注意问题 1、所有资料都必须转换为数值,不允许使用字母或其他字符。 2、每一个数值码占据一列,要为每个变量留出足够的列数。 3、对无信息的答案赋予标准代码。 4、每条记录的第一个字段都为被调查人号码,即问卷编号。 三、数据录入 (一)含义 将问卷或编码表中的每一个项目对应的代码读到磁盘、磁带中,或通过键盘直接敲入计算机中。 (二)注意点 提供每个录入员一份记录清楚的录入说明。 开始录入前几个个案时,研究人员必须在场。 决不能假定录入人员是懂得如何做数据录入的。 如有可能,就对录入的数据进行全面核查,或采取抽查(25%左右)。 四、数据净化 对录入资料中可能潜存的错误进行检查和修正的工作,就称为资料净化。现在常常在数据已经输入到计算机系统之后,采用资料净化的方法来检查资料的错误。 资料净化的方法通常有两种,一是检查在指定编码之外是否存在其他编码。二是运用变量之间的逻辑关系来检查资料是否有错误。当然,在实际的市场调研中,常常结合使用两种资料净化方法,以保证数据的质量和研究结论的可靠性。 第二节 资料的初步分析—列表 把调查资料按照一定的目的、用表格的形式展现出来,即是资料的列表(tabulation)。 列表的基本方法就是计数变量值的出现次数。 单向列表(one-way tabulation):仅计数一个变量的不同数值的出现次数。 交叉列表(cross tabulation):同时计数两个或多个变量的不同数值联合出现的次数。 单因素表格化分析 单向频数表:显示对某一问题作出每种回答的人的数量的表。 单向频数表 单向列表的主要描述量 集中趋势描述量:众数、中位数、平均数 离散趋势描述量:标准差、离异比率、四分位差 多因素列表分析 双向交叉列表 双向交叉列表是同时有两个变量参加交叉分组的频次分布表,这种频次分布表称为列联表。 三变量交叉列表 在二变量交叉列表分析的基础上,加入第三个变量。通过加入第三个变量,原有二变量交叉列表分析的结果可能出现四种情况。 一是更精确的反映原有两个变量之间的联系。 二是可以说明原有两个变量之间不相关,尽管用二变量交叉列表分析结果显示两者之间相关。 三是可能使原二变量之间通过二变量交叉列表分析得出的两者不相关的结论,通过加入第三个变量,显示原二变量之间存在某些相关联系。 四是可能显示原有的联系没有改变。 讨论题 1.如果你负责指定交叉分组表的类型,你将对哪些问题进行交叉分组表分析? 2.假设你只能指定10种交叉组表,你会选择哪10个? 讨论题 1.如果你需要对小组调研课题进行数据分析,你的单变量分析计划和双变量分析计划如何制定? 2.假设你只能指定10种交叉组表,你会选择哪10组? 思考题 1、什么是资料的编辑? 2、什么是编码?如何对开放式问题进行编码? 3、什么是列表、单向列表和交叉列表含义? 4、什么叫编码明细表?在制定编码明细单需要注意的问题有哪些? 5、结合教材内容246—255页内容,计算下列数据组的平均值、中位数、众数和标准差。 6、在样本含量为1000位成年人的一项市场调查中,采用了7级量表测量消费者对某巧克力产品的诸特性的重要性的评价,其中7表示该特性非常重要,1表示非常不重要。假定对某特性x的调查结果为下表。试计

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档