Excel数据分析实务-PPT课件 项目7 使用Power Query方法处理数据.pptx

Excel数据分析实务-PPT课件 项目7 使用Power Query方法处理数据.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
使用Power Query方法处理数据;;Power Query(查询增强版)为Excel的一个插件,实现数据获取和数据清理。 Power Query在Excel中通过简化数据发现、访问和合作的操作,从而增强了商业智能自助服务体验。 Power Query将不同来源的数据源整合在一起,建立好数据模型,为使用Excel、Power Pivot、Power View、Power Map进行进一步的数据分析做好准备。;; 单击【从文本】命令:新建一个名为“消费行为分析表(清洗完数据)”的工作簿,在【数据】选项卡的【获取和转换】命令组中,依次单击【新建查询】图标→【从文件】命令→【从文本】命令。; 选择需要导入的学生ID表:在弹出的【导入数据】对话框中,选择“学生ID表.txt”,单击【导入】按钮。 加载学生ID表:在弹出左图所示的【学生ID表.txt】对话框中,单击【加载】按钮,即可在Excel中新建一个【Sheet2】工作表存放学生ID表,如右图,将【Sheet2】工作表重命名为“学生信息表”。; 单击【从CSV】命令:在【数据】选项卡的【获取和转换】命令组中,依次单击【新建查询】图标→【从文件】命令→【从CSV】命令。 选择需要导入的消费记录表。 加载消费记录表:在弹出的【消费记录表.csv】对话框中,单击【加载】按钮,即可在Excel中新建一个【Sheet3】工作表存放学生ID表,将【Sheet3】工作表重命名为“消费记录表”,删除【Sheet1】工作表。;;一般情况下,学生在食堂消费不会过高,消费时间也应在处于食堂的正常营业时间内,当出现超过最大消费金额或非营业时间的消费记录时,说明这部分数据为异常数据。 因此需要对【消费记录标】中的“消费金额(元)”“消费类型”“消费时间”列进行异常值分析,并删除存在的异常值: 处理消费金额的异常值 : 消费金额大于或等于300元为异常消费金额 , 做删除处理 。 处理消费类型的异常值 : 消费类型有存款、退款、无卡销户和消费4种消费类型,但是本项目主要分析的是消费类型,所以需要将非消费的数据进行删除 。 处理消费时间的异常值 :在【消费记录(清洗完数据)】工作表中,所有的营业地点的营业时间为6:00~24:00,因此0:00~5:00之内的所有消费记录属于异常情况,需要对0:00~5:00之内的???费数据进行删除。 ; 在【查询】选项卡的【编辑】命令组中,单击【编辑】图标,即可打开【消费记录表 - Power Query编辑器】。;处理消费金额的异常值;处理消费金额的异常值; 显示“消费类型”列的取值:单击“消费类型”列旁边的倒三角按钮,在下拉列表中,单击【加载更多】命令,即可显示消费类型的4种取值。;处理消费类型的异常值; 添加“小时”列:在【添加列】选项卡的【从日期和时间】命令组中,依次单击【时间】图标→【小时】命令→【小时】命令,此时在表的最后一列将会增加“小时”列。;处理消费时间的异常值;如果消费记录表中存在大量的缺失值,那么可能会造成分析结果的偏差。 因此需要对【消费记录表】进行缺失值的统计,并对存在缺失值的列进行处理。对于缺失值较大的列,且在实际的数据分析中无意义时,予以删除处理。 ; 查看第一列是否有缺失值:单击“序号”列旁边的倒三角按钮,在下拉列表中单击【加载更多】命令,查看数据是否存在空值。 查看其他列是否有缺失值:按照上一步的方法,对其他列进行查看,发现“消费项目的序列号”列只有一个取值,即空值“NULL”。 ;处理缺失值;保存处理结果:单击【消费记录表 - Power Query编辑器】界面左上角的【文件】,选择【关闭并上载】命令。;每位学生的校园卡号和门禁卡号都是唯一的,如果出现了重复值,那么说明数据是有问题的。因为不可能出现两个相同校园卡号的学生,也不可能出现两个相同门禁卡号的学生,所以需要删除此类重复值。 因此,需要检查校园卡号和门禁卡号是否存在重复值,并对重复值进行去重处理。; 打开【学生ID表 - Power Query编辑器】:在【学生信息表】工作表中,将鼠标光标移至【工作簿查询】窗格的【学生ID表】,会出现学生ID表的加载信息,单击下方的【编辑】命令。 ;处理重复值;处理缺失值;

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档