- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8讲 数据分析
市场调研 Marketing Research **学院 **** 二零零八 · 一 了解数据准备的含义; 掌握数据准备的步骤和操作方法; 了解常见的数据分析技术分类方法; 掌握数据描述主要指标含义和方法; 掌握列联表、方差分析的应用; 理解因子分析、聚类分析和判别分析的联系和分析方法。 数据分析包含两个基本工作步骤:数据准备和数据分析。 数据准备:是对收集来的原始数据进行一列处理,形成数据分析所需的标准数据表的过程。 数据分析:是运用一定的分析方法对数据进行处理,使其显示出解决管理决策问题和营销研究问题所需信息的过程。数据准备一般包括问卷的物理检查、编码、录入、清理、转换、保存等步骤。 检查的内容包括: ①问卷是否填写完整; ②是否存在规律性回答 ③是否存在没有按要求回答,并尽可能了解其中的原因。 问卷不完整的处理方法: ①数据缺失较少,直接保留记录,按记录的实际情况进入分析,所缺数据按缺失值处理; ②当样本量较小时,缺失值又十分重要,根据问卷作业证明记载信息进行回访,尽可能补上缺失值; ③当样本量较大时,问卷的缺失值较多,采用直接丢弃整份问卷或部分数据。 矩阵式原则:是针对整体数据编排格式而言的,即最终数据表必须是一张由若干行和若干列组成的矩阵式数据表格。 排他性原则:在一定范围内,一个编码只能对应一个变量或答案,每个答案(包括没有作答、无法作答等情况)都有一个代码与之对应,不能存在相互交叉。需要强调的是,当一个变量的答案是多选时,对于每一种答案应采用一个代码进行列示,对受访者没有选中(注意:应区别没有回答的代码)的答案分配一个统一的代码。 【例】您的性别是:□男 □女 这一问题的编码应包括: 变量:性别,或gend=性别 答案:0=女;1=男;2=没有回答 如果通过电脑辅助电话访谈(CATI)或电脑辅助人员访谈(CAPI)收集数据,研究者可以直接得到电子版数据表。 对于非电脑辅助调查,研究者需要通过一定的手段将数据转录为电子表格。 手工键盘录入应采用二次录入,通过两次录入的结果对比检查有无差异,或者抽取部分问卷录入结果进行核查,核查比例一般不低于25%。 数据清理的任务包括检查数据的一致性和处理缺失值。 一致性检查包括三项基本工作: 第一,检查有无超出编码定义范围的数据存在; 第二,检查有无答案的逻辑矛盾; 第三,检查有无两行或多行数据完全一致或绝大部分一致。 缺失值处理方法一般有: ①用均值代替; ②用估计值代替; ③整例删除; ④结对删除。 数据保存应注意以下几点: 第一,多份实时备份,手工输入数据文件被破坏带来的物质和精神损失是巨大的; 第二,保存格式通用,因为数据表可能供分析员在不同的软件上使用,保存格式通用可以省去很多麻烦,节约大量的时间; 第三,数据表需编号,数据表编号最好采用文字加数字的方法,便于识别数据内容和状态,这一点对于大规模数据分析十分重要。 依据测量尺度不同,数据分析技术被分为非测量型数据技术(nonmetric)和测量型数据技术(metric),非测量型数据包括定类尺度和定序尺度,它们在本质上主要反映事物的分类,没有真正的测量含义;测量型数据包括定距尺度和定比尺度,它们都能够测量变量的值。 依据统计技术属性,数据分析技术被分为因果技术(dependence technique)和相依技术(interdependence technique),因果技术适用于一个或多个变量作为因变量,其他变量作为自变量的情况;相依技术适用于变量没有自变量和因变量之分,只是测试变量之间的相关性或个体之间变量的相似程度。 按分析变量数量的不同,数据分析技术被分为单元统计技术(univariate technique)和多元统计技术(multivariate technique)。单元分析技术适用于单个元素分析,单元素的衡量指标或多或少;多元统计技术适用于分析多个元素之间的关系,或多个元素同时对某一个因素的影响。 集中趋势:用来反映数据的一般水平,常用的指标有平均值、中位数和众数等; 离散趋势:主要用来反映数据之间的差异程度,常用的指标有方差、标准差、全距、最大值和最小值。 频数分析:利于研究者初步观察一些统计规律。 数据分布:统计分析中,通常要假设样本的分布属于正态分布,因此要用偏度和峰度两个指标来检查样本是否符合正态分布。 某保险公司有20个保险销售分公司,各公司2006年取得的销售业绩(单位:万元)如下,对销售业绩进行描述分析。 列联表
您可能关注的文档
- 百分数的意义和读写 新人教版 课件.ppt
- 盾构隧道挖掘机润滑.ppt
- 盾构隧道施工课件.ppt
- 督导部的年度计划.ppt
- 盾构隧道的设计.ppt
- 矢量扁平风年终工作总结汇报ppt模板.pptx
- 磁带录音档案的管理课件.ppt
- 福建省泉港三川中学九年级数学下册:27.2.4《二次函数的图象及性质》课件(华东师大版).ppt
- 福建省泉港三川中学九年级数学下册:27.1《二次函数》课件(华东师大版).ppt
- 福建省泉港三川中学九年级数学下册:第27章《二次函数》复习课件(华东师大版).ppt
- 2023咸阳职业技术学院招聘笔试真题参考答案详解.docx
- 2023四川化工职业技术学院招聘笔试真题及参考答案详解.docx
- 2023哈尔滨职业技术学院招聘笔试真题及参考答案详解.docx
- 2023商洛职业技术学院招聘笔试真题及答案详解1套.docx
- 2023呼伦贝尔职业技术学院招聘笔试真题参考答案详解.docx
- 2023南阳农业职业学院招聘笔试真题参考答案详解.docx
- 2023天津公安警官职业学院招聘笔试真题带答案详解.docx
- 2023年上海电机学院招聘笔试真题参考答案详解.docx
- 2023年四川艺术职业学院招聘笔试真题参考答案详解.docx
- 2023安徽体育运动职业技术学院招聘笔试真题及答案详解一套.docx
文档评论(0)