- 1、本文档共86页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
节 数据图表展示
第3章 数据的图表展示 3.1 数据的预处理 数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。 3 .1. 1 数据审核 数据整理时,首先需要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。 完整性。应调查单位是否有遗漏,所有的调查项目或指标是否填写齐全。 准确性。数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。 审核数据准确性的方法:逻辑检查和计算检查。 逻辑检查主要用于对分类的数据和顺序的数据的审核,它是从定性角度。 计算检查主要用于对数值型数据的审核,它是检查调查表中的各项数据在计算结果和计算方法上有无错误。 对于通过其他渠道取得的二手数据,除了对其完整性和准确性进行审核外,还应着重审核数据的适用性和时效性。 适用性。有些二手数据可能是为特定目的通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。 时效性。对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义。 审核中发现的错误应尽可能予以纠正。如果对数据中发现的错误无法纠正,就需要对数据进行筛选。 3.1.2 数据筛选 将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。 EXCEL操作 ■数据——筛选——自动筛选——统计学下拉三角——选75——确定 ■数据——筛选——自动筛选——英语下拉三角——前10名——将“10”改为“3”——确定 ■创建条件区域(字段,条件)——数据——筛选——高级筛选——选查询数据区域——选条件区域——确定 3.1.3 数据排序 数据排序是按一定顺序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查纠错,以及为重新归类或分组提供方便。 在某些场合,排序本身就是分析的目的之一. 如美国的《财富》杂志每年都要在全世界范围内排出500强企业,通过这一信息,不仅可以了解自己企业所处的地位,清楚自己的差距,还可以从一定侧面了解到竞争对手的状况,从而有效制定企业发展的规划和战略目标。 排序后的数据我们称为顺序统计量。 如对表3-1按总分数从高到低排序。 数据——排序——第一关键字段中选英语——降序——确定 3.1.4 数据透视表 利用数据透视表可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。 在利用数据透视表时。数据源表中的首行必须有列标题。 数据——数据透视表和数据透视图——选数据透视表,下一步——选输出到新工作表或现有工作表,如选现有,要指定位置。——选布局,性别托入行标志,买衣物首选因素托入行标志,家庭所在地托入列标志,两个支出数据托入数据区。——确定——完成。 建数据透视表步骤:利用向导 注意:行字段、列字段、数据项的选择,不同的选择就会得到不同的数据透视表。 本例中,性别和买衣物首选因素作为行字段,家庭所在地作为列字段,平均月生活费和月平均衣物支出作为数据字段。 3.2 品质数据的整理与展示 品质数据包括分类数据和顺序数据。 不同类型的数据采取不同的处理方法。 对品质数据做分类整理,对数值型数据则主要是做分组整理。 3. 2. 1 分类数据的整理与图示 分类的数据本身就是对事物的一种分类,因此在整理时除了列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数值及其特征有一个初步的了解。 1、频数与频数分布 (1)频数(frequency) 频数也称次数。频数是落在各类别中的数据个数。我们把各个类别及其相应的频数全部列出,并用表格形式表现出来,就是频数分布。将频数分布用表格的形式表现出来就是频数分布表。 见书上例3.3(P51) 不同性别顾客的频数分布 不同类型饮料的频数分布 (2)比例 一个总体(或样本)中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。 假定总体N个数据分成K个部分,每一部分的数据分别为 N1,N2,N3,…,NK 比例:Ni/N(i=1,2,…,K) 显然, N1/N+N2/N+…,+NK/N=1 (3)百分比 将比例乘以100就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。当分子的数值很小而分母的数值很大是,我们也可以有千分数“‰”表示比例,如人口出生率、死亡率、自然增长率等都用千分数表示。 (4)
您可能关注的文档
- 脂肪烃(43张PPT).ppt
- 腾讯内部经典PPT模板.ppt
- 脚本语言(一).ppt
- 脑室系统.ppt
- 膏方漫谈.ppt
- 自动孔修补(Auto Hole Patch).ppt
- 自动执行.ppt
- 自发过程第二定律.ppt
- 自感 互感现象.ppt
- 自我指导训练.ppt
- 2024医师定期考核考前冲刺试卷及参考答案详解【突破训练】.docx
- 2024医师定期考核考前冲刺练习(网校专用)附答案详解.docx
- 广西壮族自治区来宾市2022-2023学年七年级下学期期末地理试题(含答案).docx
- 2024医师定期考核考前冲刺试卷及参考答案详解(新).docx
- 2024医师定期考核考前冲刺试卷【精选题】附答案详解.docx
- 2024医师定期考核考前冲刺试卷及参考答案详解【名师推荐】.docx
- 2024医师定期考核考前冲刺练习(重点)附答案详解.docx
- 2024医师定期考核考前冲刺练习(重点)附答案详解.docx
- 《农业产业链金融创新与新型农业经营主体融资困境突破》教学研究课题报告.docx
- 2024医师定期考核考前冲刺试卷含答案详解(培优B卷).docx
最近下载
- GB 44022-2024硝酸铵安全技术规范解读.pptx VIP
- 在线网课学习课堂《人工智能与生物特征识别(北理 )》单元测试考核答案.pdf VIP
- Unit 5 Is this your pen (说课稿)-2024-2025学年湘少版(三起)(2024)英语三年级上册.docx VIP
- 《基坑工程》重力式水泥土墙.pptx VIP
- 人工智能导论知到课后答案智慧树章节测试答案2025年春浙江师范大学.docx VIP
- 2024年饮品店项目创业投资方案.docx
- 生命的律动答案.docx
- 300T汽车吊性能说明书-XCA300_1全地面起重机技术规格书+[主臂风电臂加超起].pdf VIP
- 导尿管相关尿路感染预防与控制课件.pptx VIP
- 历史的天空2015全图文攻略.pdf VIP
文档评论(0)