大数据技术在财务中的应用(Power BI版) 课件 项目3、4 Power Query数据清洗、 Power BI数据建模.pptx

大数据技术在财务中的应用(Power BI版) 课件 项目3、4 Power Query数据清洗、 Power BI数据建模.pptx

Power Query数据清洗;Power BI可以获取多种数据源,常用的数据源包括Excel等单个文件、Web数据、MySQL数据库等; 获取单个Excel文件和文件夹的操作,注意文件夹的文件格式需要一致; 获取网页数据、Python脚本以及MySQL数据库的操作;;01;认识Power Query;Power Query是Power BI的数据查询模块,它的作用可以对数据表进行清洗和整合。在获取数据后,可能会存在很多“脏数据”,而Power Query可以高效的实现对数据清洗整理,让数据表变得更加规范。;进入到Power Query的界面有两种方式:一种是在加载数据之前,即导入数据之后,在“导航器”点击“转化数据”;另外一种是在加载数据之后,在Power BI的主页的“转化数据”,两种都可以进入Power Query界面。;筛选上下文;常用功能;筛选上下文;筛选上下文;如果导入数据后标题行并没有识别,那么点击“主页”功能区的“将第一行用作标题”,标题行就会下移一行,如图所示。;删除列的方式有几种,选择一列或者多列,鼠标右键,在弹出对话框中选择“删除”,或者点击主页中的“删除列”,所在列就会被删除。;在“主页”功能区有“删除行”,可选择删除前几行或后几行,以及间隔行、重复行等。;添加列的方式较多,可以添加条件列、索引列、重复列以及自定义列。条件列即按照一定的条件添加列,重复列即复制新的列,自定义列可以按照自定义方式新增列。;透视,称为列的透视,是一维表转换到二维表的过程,是对数据分类聚合;而逆透视,称为列的逆透视,是把二维表转换到一维表的过程。一般而言,二维表往往用于分类汇总,而一维表更方便分析和计算。;拆分;数据加载后,Power Query会自动将源列的数据转换为能更好地支持高效的存储、计算的数据类型。通常情况下,还需要进行手动转化,选择所在列,点击适合的数据类型。;替换是将原来的值替换为新的值,具体操作是点击“主页”功能区的“替换值”,在弹出对话框中输入要查找的值以及要替换的新值。;Power Query提供了两种方式的合并文件,一种追加查询,即将相同结构的表格拼接在一起,这是一种纵向的连接方式;另外一种是合并查询,是横向的汇总,它与Excel中Vlookup函数功能非常相似。两种查询方式均在“主页”功能区。;步骤:在“主页”→“追加查询”→“将查询追加到新查询”,选择两个合并表格,选择需要合并的两张表格,点击“确定”。注意的是追加的两张表的标题列要一致。;步骤:在“主页”→“合并查询”→“将查询追加到新查询”,选择两个合并表格,选择需要合并的两张表格以及相同的列,点击“确定”。注意的是合并的两张表格要有相同的列。;;应用技巧;筛选上下文;;;筛选上下文;Power Query的的三大功能区、常用功能区、数据视图区、应用步骤区; 常用功能区包括将第一行应用标题、增删行列、逆透视、数据合并、数据拆分、分类汇总等常用功能; 数据视图对表格管理、应用步骤是对步骤的删除和修改;;;Power BI数据建模;课前回顾;;Power BI数据模型是Power BI中的核心概念之一,它是用于组织和管理数据的结构。数据模型是由数据源中的表、关系、计算列和度量值等组成的,它提供了一个统一的视图来理解和分析数据。;数据模型关系;在销售表和商品表中,存在相关的列,即销售表中的产品ID列和商品表中的产品代码列具有关联关系。数据建模的目的在于识别不同表格之间的关系,并通过关联具有共同字段的表格,构建一个多维数据模型。;筛选上下文;了解数据表的类型有助于更好地建立表与表之间的关联。一般而言,我们可以将数据表的类型分为以下三种:;筛选上下文;筛选上下文;筛选上下文;新建度量值;筛选上下文;筛选上下文;筛选上下文;筛选上下文;筛选上下文;筛选上下文;筛选上下文;数据建模是用于建立不同数据表之间联系的过程。数据表可以分为事实表、维度表和辅助表。而表与表之间的关系包括一对一、一对多(多对一)和多对多。 数据关系管理是在建模视图中进行的,可以通过自动创建或手动创建来管理模型之间的关系。 度量值可以被理解为带有计算功能的工具,类似于带有漏斗的计算器。它们非常强大,并且使用DAX表达式进行计算的方式与计算列相同。;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档