- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 统计数据的整理与展示 主要内容 统计数据的预处理 非数值型数据的整理与显示 数值型数据的展示与显示 Excel的应用 3.1 统计数据的预处理 3.1.1 统计数据的审核 审核数据的完整性和准确性。 完整性:调查单位是否有遗漏 调查项目是否填写齐全 准确性: 数据是否有错误 是否存在异常值 (方法:逻辑检查、计算检查) 3.1.2 数据的筛选 筛选内容: 1.将某些不符合要求的或有明显错误的数据予以剔除; 2.将符合某种特殊条件的数据筛选出来。 筛选方法: 计算机:“数据”——“筛选” 3.1.3 数据排序 作用: 1.便于通过浏览数据发现一些明显的特征或趋势,为分类(组)提供方便 2.检查纠错; 排序标志: 字母、汉字、数值;升序或降序 Excel的应用: 3.2 非数值型数据的整理与显示 3.2.1 分类数据整理(基本过程) 1.列出各类别 2.计算各类别数据的频数(个数) 3.制作频数分布表 4.用图形显示数据 1) 频数分布 将统计数据分成几类(组),汇总计算各类(组)的数据个数,并用表格的形式表现出来,这种形式称为频数分布或次数分布。 各类(组)数据的个数称为频数或次数,它与全部数据个数之比称为频率。 频数分布的特点:各类(组)的频率大于或等于0;各类(组)的频率之和为1或100%。 频数分布的作用: 揭示现象的类型 反映现象的内部构成 2)例题分析 一家市场调查公司为研究 不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的名称记录一次。以下是记录的原始数据。. 旭日升冰茶可口可乐 旭日升冰茶 汇源果汁 露露 露露旭日升冰茶 可口可乐 露露 可口可乐 旭日升冰茶可口可乐 可口可乐 百事可乐 旭日升冰茶 可口可乐百事可乐 旭日升冰茶 可口可乐 百事可乐 百事可乐露露 露露 百事可乐 露露 可口可乐旭日升冰茶 旭日升冰茶 汇源果汁 汇源果汁 汇源果汁旭日升冰茶 可口可乐 可口可乐 可口可乐 可口可乐百事可乐 露露 汇源果汁 百事可乐 露露可口可乐 百事可乐 可口可乐 露露 可口可乐旭日升冰茶 百事可乐 汇源果汁 旭日升冰茶 不同饮料销售分布表 频数分布由两部分组成: 分组形成的组别; 与各组对应的总体单位数(频数或次数)。 当以频率表示各组在整体中的相对地位时,即为频率分布。 3) 分类数据频数分布 的图示 条形图(直方图) 饼图(圆形图) 分类数据的图示——柱形图 柱形图 用宽度相同的条形的高度或长短来表示各类别数据个数多少的图形 有单式条形图、复式条形图等形式 各类别可以放在纵轴,称为柱形图,也可以放在横轴,称为条形图 分类数据的图示—饼图 饼图 也称圆形图,是用圆形及圆内扇形面积来表示数值大小的图形 主要用于表示总体的内部结构 绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的 4) 用Excel编制频数分布的步骤 在同一列输入分类数据资料; 给每类分别赋值,并输入在第二列; 点击“工具”—“数据分析”—“直方图”—填写对话框—“图表输出”—“确定”; 将输出结果转化为易于阅读的表格形式。 5)用Excel制作统计图的步骤 输入分类数据频数分布; 点击“图表向导”的图标,选择需要的图形; 填写对话框; 对输出结果进行个性化的修饰。 3.2.2 顺序数据的分类整理与图示 与分类数据不同的是: 1.给每一类别赋值时必须考虑顺序 2.可以计算频数或频率的累计数 向上累计:由较低水平的次数开始累计; 向上累计:由较高水平的次数开始累计。 例题分析 在一项城市住房问题的研究中,研究人员在某城市抽样调查50户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?” 1.非常不满意;2.不满意;3.一般; 4.满意; 5.非常满意。 将调查的资料分类整理。 顺序数据的频数分布 3.3 数值型数据的整理与显示 3.3.1 数值型数据频数分布的种类 各类频数分布的适用情况 若数据是离散型变量且变化范围不大——单项式; 连续型变量、离散型变量且变化范围较大——组距式; 若变动比较均匀——等距式; 若变动不均匀——异距式。 3.3.2 关于组距式频数分布 1)概念 组限:上限、下限 组距=上限-下
文档评论(0)