网站大量收购独家精品文档,联系QQ:2885784924

第3章 数据的处理.pptx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据分析基础主讲人:XXX

第三章数据的处理3.1数据清洗3.2数据加工3.3数据修整3.4练习

知识目标:

1.了解数据不一致、数据错误、数据缺失、数据重复给数据分析工作带来的危害。2.理解用移动平均法修整数据的思路。3.熟练掌握Excel内置函数Vlookup、Index、Match、If、Isodd、Int、Round、Left、Right、Mid、Year、Month、Day、Weekday、Today、Date的功能和参数要求。

技能目标:

1.灵活通过“查找和替换”对话框以及函数对数据进行一致性处理。2.熟练运用字段分列对字段进行拆分、变形。3.灵活运用Excel公式与函数对数据进行抽取、匹配、转换、计算、修整。4.熟练运用数据分析工具“移动平均”进行数据修整。

素质目标:

1.认识数据处理的重要性,培养重视基础工作的职业素养。2.灵活掌握数据处理的各种方法和技巧,培养创新意识。3.熟练掌握Excel各种内置函数的功能和应用,践行强国先强己的责任担当。

数据清洗3.1

数据清洗就是对格式错误的数据进行纠正,将错误的数据纠正或删除,将缺失的数据补充完整,将重复的数据删除。数据清洗第三章数据的处理3.1数据清洗

3.1.1数据一致性处理第三章数据的处理3.1数据清洗图3-1-1数据格式不一致的资料

数据一致性处理第三章数据的处理3.1数据清洗1清洗出生日期清洗身高2案例操作(39-42页)

3.1.2缺失数据处理第三章数据的处理3.1数据清洗数据清单中,单元格如果出现空值,就认为数据存在缺失。缺失数据的处理方法通常有以下3种:?用样本均值(或众数、中位数)代替缺失数据;?将有缺失数据的记录删除;?保留该记录,在要用到该数据做分析时,将其临时删除案例操作(42-43页)

3.1.3重复数据处理第三章数据的处理3.1数据清洗重复数据是指每个字段都完全相同的记录。如果一条记录重复出现,会影响分析的结果,因此在分析数据之前必须将重复记录删除案例操作(43页)

数据加工3.2

数据加工的手段主要有第三章数据的处理3.2数据加工字段分列字段匹配数据转换数据计算字段抽取

3.2.1字段分列第三章数据的处理3.2数据加工所谓字段分列,就是将一个字段分成多个字段。案例操作(44-46页)

3.2.2字段抽取第三章数据的处理3.2数据加工字段抽取是指利用原数据清单中某些字段的部分信息得到一个新字段。1.字符串抽取函数常用的字符串抽取函数有Left、Right、Mid。?Left(文本字符串,截取的长度)——从文本字符串的左边截取指定个数的字符。?Right(文本字符串,截取的长度)——从文本字符串的右边截取指定个数的字符。?Mid(文本字符串,起点位置,截取的长度)——从文本字符串的中间某个位置开始,截取指定个数的字符。案例操作(46页)

第三章数据的处理3.2数据加工2.日期抽取函数常用的日期抽取函数有Year、Month、Day、Weekday。?Year(日期)——从日期型数据中提取年份。?Month(日期)——从日期型数据中提取月份(1~12)。?Day(日期)——从日期型数据中提取日(1~31)。?Weekday(日期,2)——返回日期型数据的星期(1~7)。1表示星期一,2表示星期二,3表示星期三,4表示星期四,5表示星期五,6表示星期六,7表示星期天。案例操作(47页)

3.2.3字段匹配第三章数据的处理3.2数据加工1.精确匹配2.模糊匹配3.Index+Match匹配案例操作(47-49页)案例操作(49-50页)案例操作(51页)

3.2.4数据转换第三章数据的处理3.2数据加工1.数据转置2.多列转一列3.一列转多列案例操作(52页)案例操作(52-53页)案例操作(53-54页)

3.2.5数据计算第三章数据的处理3.2数据加工有时候,我们需要的数据并不存在于数据清单中,而是要通过对其他字段进行数学计算或函数计算来获取。案例操作(54-56页)

数据修整3.3

第三章数据的处理3.3数据修整在一段较长的时间内,由于普通的、持续的、决定性等基本因素的作用,总体往往呈现逐渐向上(见图3-3-1)或向下变动的趋势。图3-3-1明显的向上趋势

第三章数据的处理3.3数据修整在这样的趋势中,也不排除受一些偶然因素或不规则因素的影响,出现与整体趋势相差很大的极端数据,如图3-3-2中箭头所指的数据。如果直接对这些极端数据

文档评论(0)

学海无涯而人有崖 + 关注
实名认证
内容提供者

教师资格证、人力资源管理师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年06月11日上传了教师资格证、人力资源管理师

1亿VIP精品文档

相关文档