[PPT模板]第3章 数据的图表展示.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[PPT模板]第3章 数据的图表展示

数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。 3 .1. 1 数据审核 数据整理时,首先需要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。 (1)完整性。应调查单位是否有遗漏,所有的调查项目或指标是否填写齐全。 (2)准确性。主要审查数据资料是否真实地反映了客观实际情况,如内容是否符合实际;检查数据是否有错误;计算是否正确,是否存在异常值等。 对于通过其他渠道取得的二手数据,除了对其完整性和准确性进行审核外,还应着重审核数据的适用性和时效性。 (1)适用性。有些二手数据可能是为特定目的通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。 (2)时效性。对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义。 审核中发现的错误应尽可能予以纠正。如果对数据中发现的错误无法纠正,就需要对数据进行筛选。 3.1.2 数据筛选 一是将某些不符合要求的数据或有明显错误的数据予以剔除; 二是将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。 EXCEL操作(演示) ■数据——筛选——自动筛选——统计学下拉三角——选75——确定 ■数据——筛选——自动筛选——英语下拉三角——前10名——将“10”改为“3”——确定 ■创建条件区域(字段,条件)——数据——筛选——高级筛选——选查询数据区域——选条件区域——确定 3.1.3 数据排序 数据排序是按一定顺序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查纠错,以及为重新归类或分组提供方便。 在某些场合,排序本身就是分析的目的之一。 如美国的《财富》杂志每年都要在全世界范围内排出500强企业,通过这一信息,不仅可以了解自己企业所处的地位,清楚自己的差距,还可以从一定侧面了解到竞争对手的状况,从而有效制定企业发展的规划和战略目标。 排序后的数据称为顺序统计量。 如对表3-1按总分数从高到低排序。(见例3.1) 数据——排序——主要关键字段中列——降序——确定(演示) 3.1.4 数据透视表 利用数据透视表可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。 在利用数据透视表时,数据源表中的首行必须有列标题。 数据——数据透视表和数据透视图——选数据透视表,下一步——选输出到新工作表或现有工作表,如选现有,要指定位置——选布局,性别拖入行标志,买衣物首选因素拖入行标志,家庭所在地拖入列标志,两个支出数据拖入数据区——确定——完成。(演示) 注意:行字段、列字段、数据项的选择,不同的选择就会得到不同的数据透视表。 本例中,性别和买衣物首选因素作为行字段,家庭所在地作为列字段,平均月生活费和月平均衣物支出作为数据字段。 3.2 品质数据的整理与展示 品质数据包括分类数据和顺序数据; 不同类型的数据采取不同的处理方法; 对品质数据做分类整理,对数值型数据则主要是做分组整理。 分类数据本身就是对事物的一种分类,因此在整理时除了列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。 1.频数与频数分布 (1)频数(frequency) 频数也称次数。频数是落在各类别中的数据个数。我们把各个类别及其相应的频数全部列出,并用表格形式表现出来,就是频数分布。将频数分布用表格的形式表现出来就是频数分布表。 表3-5 不同类型饮料的频数分布 表3-6 不同性别顾客的频数分布 (2)比例 一个样本(或总体)中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。 假定总体N个数据分成K个部分,每一部分的数据分别为 N1,N2,N3,…,NK 比例:Ni/N (i=1,2,…,K) 显然, N1/N+N2/N+…+NK/N=1 (3)百分比 将比例乘以100就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。当分子的数值很小而分母的数值很大时,我们也可以用千分数“‰”表示比例,如人口出生率、死亡率、自然增长率等都用千分数表示。 (4)比率 比率是各不相同类别数值之间的比值。 比率可以是一个样本(或总体)中各不同部分的数量之比。比如,国内生产总值中第一、二、三产业之

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档