- 1、本文档共237页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四部分-数据分析
第四部分:数据分析 一、数据处理 二、数据分析 一、数据处理 1、初步处理 1、编辑 2、编码 3、赋值 2、基本描述统计 集中趋势的测量 离散程度的测量 单变量频数分析表 1、初步处理 1、编辑 编辑是为了提高问卷数据的准确性和精确性而对数据收集表格进行的再检查,目的是筛选出问卷中看不清楚、不完整、不一致或模棱两可的答案。 方式: (1)现场编辑:当场对于收集的所有数据进行检查 (2)办公室编辑:也称为最终编辑。审核调查问题的一致性和准确性,做出必要的更正,并决定是否应该抛弃部分或者全部数据。 例如: 1、被访者18岁,但他是博士。 2、在一份调查问卷中,受访者对所有问题的回答都是“非常赞成”。 编辑者可能发现的问题有以下几种: 1、不恰当的调查程序 2、不完整的访问 3、不恰当的访谈 4、调查问卷中或调查过程中的技术问题 5、受访者对问题的态度 6、应当解决的一致性冲突问题 2、编码 编码就是为每个问题的每种可能的答案分配一个代码,通常是一个数字。 编码的步骤: 1、对每个问题的每个答案进行有意义的分类 2、建立相互排斥和完全穷尽的编码类别 3、建立一个适合于电脑分析的数据集。 注意: 不知道和缺失值的处理。 不知道可能有两种情况:真的不知道和不愿意透露信息。 如果是前者,“不知道”作为一个独立的答案出现, 如果是后者,根据其他信息推断正确答案 处理缺失值:原因可能是调查对象拒绝回答、访谈者没有提问该问题、答案不清楚或者记录不完整。 替换缺失值 对于缺失值,有的时候需要查出来删除,有的需要作其他处理。 “转换transfrom”—— “替换缺失值replace missing values” 替换完成,出现新变量,原来是缺失值的被替换掉,非缺失值保持不变 3、赋值 为不同的回答分配适当的数值代码,即不同的回答进行量化。 单选问题的问卷,一个问题为一个变量,存储问题的答案 多选项分析 针对问卷调查中的多项式问题,即要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案。 对多选项的分解即对应设置若干个SPSS变量,分别存放描述这些问题的几个可能被选择的答案。即将一个问题分解为对多个问题的分析。 二分法 将每个答案设为一个SPSS变量,每个变量只有0或1的取值。 多项式分类法 若问卷要求被调查者最多选择三个答案,便可设置3个spss变量,分别对应第一原因,第二原因,第三原因,变量取值为多选项问题中的可选答案。 以上两种方法的区别:二分法便于分析哪一个原因是人们购买商业保险的主要原因,但是对于顺序性信息会丢失。但分类法无法方便分析有多少人是由于某个原因而去购买保险的。所以,有顺序问题——分类法,无顺序问题——二分法。 “分析”——“多重响应”——“定义变量集” 定义完所有的变量集后,就可以进行多选项频数分析了 “分析”——“多重响应”——“频数”, “分析”——“多重响应”——“频数”,将待分析的变量集选入表格, 缺失值的处理方法,第一种适合二分法,第二种适合分类法。 2、基本描述统计 集中趋势的测量 离散程度的测量 单变量频数分析表 单变量频数分析表 通过单变量频数分析,可以: 1、发现某些类型的编码错误 2、通过频数统计,可以分析被划分为一个群体的特征 3、单频数分析能够进行变量转换。 二、数据分析 1、假设检验 2、相依分析技术 3、互依分析技术 1、假设检验 参数检验 非参数检验 卡方检验 举例: 情景1:karen是一名产品经理,他的公司为顾客提供手机上网服务(具有上网和收发电子邮件功能的手机)。他正考虑是否要将该服务引入到新的市场。最近,一项对新市场400个家庭的随机抽样调查显示,该地区每个家庭的平均收入为3万元美元。基于过去的经验和对现有市场的全面研究,karen认为,只有在那些家庭平均收入高于2.9万美元的市场上,才能有利可图。那么,karen是否应该将项目引入到新市场中去呢? 情景2:tom是宝马公司广告部的经理,他正在考虑使用短片x或y以吸引年轻的消费者,这两个短片的故事里都有好莱坞的明星和宝马车,并且在故事中宝马车都起着关键作用。Tom不确定哪一个短片在吸引目标市场上更有效,该目标市场主要是针对的是18~30岁的消费者。因此,tom随机抽取了400个样本。被访者通过参与调查。在调查中,被访者可以随机选择是看短片a还是看短片y,每个短片分配200人,看过之后,要求他们回答对短片的喜爱程度。再看了短片x的200个人中,40人表示喜欢。因此,也就是说有百分之20的人喜欢短片x,而25的人喜欢短片y,那么tom是否可以得出这样一个结论,即短片y更能有效的吸引18~30岁这个年龄层的消费者呢? 情景1和情景2的共同点 ? 知识 原假设、备择假设 第一类错误、第二类错误 显著性
文档评论(0)