- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
市场营销调研第十一讲-描述统计.ppt
第12讲 资料的处理与初步分析 ——数据的处理 ——数据的描述统计 12.1 数据处理与分析过程 调研数据收集上来之后,调研人员需要做的工作有: 调查数据的编辑 调查数据的编码 调查数据的录入 调查数据的分析 根据分析所得信息回答经营管理问题 12.1 数据的编辑 编辑(数据的审核及净化) 实地编辑 现场编辑:在调查实地,或调查刚刚结束的实话展开的数据审核和净化 主要以复查和追访的方式为主 办公室编辑 后期编辑:对资料中存在的各种问题进行处理 主要是对查出的问题进行处理 12.1数据的编辑 编辑中可能发现的问题 不可能的答案 相互矛盾的答案 不规范或者不符合问卷要求 不完整答案 编辑技巧 无效问卷的剔除 空白卷和缺损问卷 同类卷 不符合要求的人填写 前后有明显的矛盾存在 对关键问题回答缺失 编辑技巧 编辑顺序错乱的回答 编辑“不知道”的回答 将所有“不知道”归为一类,独立记录在一个目录下; 将所有“不知道”答案从统计数据中剔除; 将所有“不知道”按照不同比例分配在其它答案的统计数据中去。 编辑的标注 用不同颜色的笔来编辑 12.2数据的编码 定义:编码就是将数字标度或者其它符号分配给不同答案的过程。 例:相比相同行业的其它公司而言,您的公司是: A)其中规模最大的公司之一; B)属于平均规模; C)规模很小 12.2数据的编码 编码工作的主要内容: 确定变量:对问卷中的每个问题用一个或者几个变量来对应,从而使信息得以识别。 确定变量的值: 12.2数据的编码 编码的基本原则: 首先,编码的类型是应该穷尽的。 其次,编码的类型之间应该是不相关的,相互独立的。 固定选项问题的编码 固定选项问题的编码(封闭性问题) 单选封闭式问题:略 多选封闭式问题: 方法一:设立的变量个数与问题的选项个数一样多,每个变量值取1或者0 方法二:设立变量个数为最多可选的个数 等级顺序量表:与多选问题类似 方法一:变量个数与问题选项个数一样 方法二:设立变量个数上限 注:设计问卷的同时,要考虑到问题的编码 开放式问题的编码 使用开放式问题的原因:调研者对答案可出现的情况并不十分了解 开放式问题的编码步骤: Step1:列出答案(若数据过大,可以抽取一部分); Step2:列出频数分布表; Step3:将频数小的答案尽可能的合并; Step4:为所确定分组选择正式的描述词汇; Step5:对所有问卷中开放式问题进行编码。 12.3数据的插补 插补:解决在审核(编辑)过程中辨别出来的数据缺失、无效、不一致等问题。 插补的具体工作:要改变一些回答,并对审核过程中所发现的缺失信息的记录进行补充或者代替。 插补方法: 推理插补 均值插补:利用平均值来替代 回归插补:利用回归模型 Y=aX+b 热平台插补: 使用当前调查的供者 冷平台插补: 使用其它资料中的供者 描述统计 12.4统计学基本概念 12.5 基本描述统计量 12.6 频数分析 12.7 描述统计 12.4 统计学基本概念 基本概念 总体:要进行统计推断的研究对象的全体。 样本:按照一定方式从总体中抽出一部分个体作为推断依据,这一部分个体就构成样本。 参数:总体所具有的统计数字特征,总体的参数往往未知。 统计量:根据样本观测值得到的统计数字特征,一般用样本统计量估计总体的参数。 12.5 基本描述统计量 功能 反映数据的基本统计特征 分类 描述集中趋势的基本统计量 均值 中位数 众数 总和 12.5 基本描述统计量 分类 描述离散程度的基本统计量 方差 标准差 最小值 最大值 全距 12.5 基本描述统计量 分类 描述分布形态的基本统计量 峰度 偏度 12.5.1 均值Mean 含义 表示某变量所有取值的集中趋势或平均水平; 易受极端值的影响。 数学定义 12.5.2 中位数Median 含义 将一组数据按数值大小依次排序后,处于中间位置上的变量值。 不受极端值的影响。 一般用于描述定序及定序以上测量尺度的变量的集中趋势,对定类变量通常无意义。 数学定义 数据个数为奇数,处于中间位置的那个数。 数据个数为偶数,处于中间位置的那两个数的均值。 12.5.3 众数Mode 含义 一组数据中出现频数最多的变量值。 不受极端值的影响。 适用于任何测量尺度的变量。 可以直接从变量的频数分布表得到。 12.5.4 总和Sum 含义 反映某变量的总体取值。 数学定义 12.5.5 方差Variance 含义 表示某变量所有取值的离散程度,即关于均值的平均离散程度; 易受极端值的影响。 方差越小,观测值越向均值集中。 方差越大,观测值与均值越分散。 数学定义 12.5.6 标准差Std.deviat
您可能关注的文档
- 地理必修三第二章荒漠化的防治.doc
- 城南学校学科教案模板.doc
- 基于标准第五单元.doc
- 基因专题复习教案.doc
- 基因工程实验教学教案.doc
- 基因工程实验教案.doc
- 基因的分离定律第二课时.doc
- 基本不等式及其应用(第一、二课时).doc
- 基础会计_第十四章会计规范体系.ppt
- 基础会计学第一二章课件.ppt
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)