数据分析与数据可视化实战-全套PPT课件.pptx

数据分析与数据可视化实战-全套PPT课件.pptx

  1. 1、本文档共505页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据分析与

数据可视化实战;;数据分析的基本概念;数据分析的基本概念

;数据、数据分析与数据价值;横截面数据

时间序列数据;数据分析

使用适当的统计分析方法对数据进行分析,提取有用的信息并形成结论的过程。

主要侧重于描述现状和分析原因。;数据挖掘

从大量的数据中,通过统计学、机器学习的方法,挖掘出未知的有价值的模式(Pattern)和知识(Knowledge)的过程。

数据分析与数据挖掘的区别

数据分析的重点在于通过观察数据,直接通过人的分析得出相应的结论,这些结论往往是表层的,通常会融入部分人的主观判断;

数据挖掘的重点则在于编写算法程序,在数据中发掘和学习深层次的知识规则。其结果往往不会受人的主观判断影响,从而更加客观。;数据可视化;数据驱动决策;数据分析师在企业中扮演的角色;数据分析的基本概念;企业级关系型数据库;订单ID;顾客ID;复杂企业级关系型数据库案例;订单ID;维度与度量;日期分区;数据分析的基本概念;定义数据分析目标;数据预处理;数据分析与模型搭建;数据产品上线与维护;本章小结;;数据分析与

数据可视化实战;;数据集简介;TPC-DS数据集

;数据集结构解析;目录销售网络(catalogsales网络);网站销售网络(websitesales网络);库存网络(inventory网络);启示与挑战;本章小结;;数据分析与

数据可视化实战;;SQLServer2019数据库管理工具;SQLServer2019安装与配置

;下载完成后,打开安装包,选择【自定义】安装类型;选择好安装路径后点击【安装】;等待安装完成即可;安装完成后,在弹出的SQLServer安装中心界面选择【安装】选项卡后,选择“全新SQLServer独立安装或向现有安装添加功能”。(也可以在“开始”菜单栏处打开SQLServer安装中心);安装规则检测标识在运行安装程序时可能发生的问题,通过安装规则检测后才能继续后面的安装过程。

;完成功能规则检测后选择安装类型,选择“执行SQLServer2019的全新安装”。

;选择Developer版本即可;在功能选择界面只勾选“数据库引擎服务”即可;首次安装选择“默认实例”即可,若过去曾经安装过SQLServer2019数据库引擎,注意实例命名需要与电脑中现有版本不同。;服务器配置界面保持默认设置即可;数据库引擎配置界面选择“Windows身份验证模式”即可,“指定SQLServer管理员”处点选【添加当前用户】即可;所有设置完毕,点选【安装】即可完成安装;接下来前往该网址下载SQLServerManagementStudio;启动SQLServerManagementStudio安装程序,根据安装向导完成安装即可。;安装完成后,从菜单栏打开SQLServerManagementStudio(以下简称SSMS)。;左键单击【连接】后,SSMS主界面如下;我们需要首先搭建TPC-DS数据库架构。右键单击界面左上角【数据库】选项卡,在下拉菜单中左键单击【新建数据库】选项卡;接下来,在【数据库名称】空白窗口填写“TPC-DS”后,左键单击【确定】即可实现数据库命名;下一步左键单击【数据库】选项卡左侧的“+”符号,可以看到新建后的TPC-DS数据集;再左键单击【TPC-DS】选项卡左侧的“+”符号,继续左键单击【表】选项卡左侧的“+”符号,可以看到除了系统表等默认表以外,并没有实质性的数据表;右键单击【TPC-DS】选项卡,在下拉菜单中选择【新建查询】,随后弹出TPC-DS数据库查询界面;通过数据导入向导导入TPC-DS数据集;尽管此时TPC-DS数据集的框架已经搭建完毕,但是数据还并没有导入。我们选择右键单击左侧第一个数据表【call_center】,在弹出的选项卡中选择【编辑前200行】,实现数据表数据预览。可以看到call_center表所有列均为空值,数据还未导入。;接下来我们将主外键约束设置SQL命令输入到TPC-DS查询界面中并执行;在此我们以store表为例简要为读者介绍SQL建表命令的基本含义。

“createtablestore”表示创建一个名为“store”的表;括号中的每一行分别定义了store表每一列的名称,数据类型和字符长度,以及是否可以存在缺失值。

如第一行表示该列名称为“s_store_sk”,数据类型为整数型“integer”,不可以存在缺失值“notnull”,其他行同理。“primarykey(s_store_sk)”用于声明该表的主键为s_store_sk。;接下来我们以store表为例介绍设置主外键约束SQL代码的基本含义。

store表作为维度表,其主键为s_store_sk,分别与store_re

文档评论(0)

粱州牧 + 关注
实名认证
内容提供者

资料收集自互联网,若有侵权请联系删除,谢谢~

版权声明书
用户编号:8036120077000004

1亿VIP精品文档

相关文档