商业智能实践数据.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商业智能实践数据

数据仓库概要 数据仓库的定义 数据仓库的特征 数据库与数据仓库 粒度的重要性 数据集市 数据仓库的定义 数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程。 DW建立目标就是把企业范围内的所有数据集成在一个大仓库中,让用户能运行查询、产生报告和执行分析。 数据仓库的特征 面向主题:数据仓库中的数据按照主题进行组织; 集成:从多个数据源将数据集合到数据仓库中,并集成为一个整体; 稳定:数据仓库中的数据通常是历史数据,很少进行更新; 时变:数据仓库中的所有数据都有特定的时间标识。 数据仓库与数据库的区别 粒度 粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。 高细节级——低粒度级 例如:一个顾客一个月内的每个电话的细节 低细节级——高粒度级 例如:一个顾客一个月内的电话的综合 粒度的重要性 在数据仓库环境中粒度之所以是主要的设计问题,是因为它深深地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。在数据仓库中的数据量大小与查询的详细程度之间要做出权衡。 数据集市的定义 数据集市是整个企业数据的一个子集,包括特定业务单元、部门或用户集的值。 数据集市是根据特定主题而不是根据数据集市数据库的大小来定义。 大纲 进一步理解商业智能 商业智能在哪些行业中应用较广 数据仓库概要 OLAP概要 数据挖掘概要 OLAP概要 OLAP的定义 OLAP的关键词 OLAP的基本操作 OLAP与OLTP OLAP是什么 OLAP是针对特定问题的联机数据访问和分析 通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。 OLAP关键词 维度 多层次 多角度 钻取 切片/切块 旋转 维度的概念 维是人们观察数据的特定角度。 例如:企业常常关心产品销售随着时间推移而产生的变化的情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。 企业也常常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。 OLAP基本操作 钻取 在一个维内部沿着层次从上到下或从下到上的方向考察数据。 如:上钻(Drill up)下钻(Drill down) 切片/切块(Slice and dice) 固定某些维成员,对其他维进行考察 旋转 按不同顺序组织各个维,对结果进行考察 OLAP与OLTP On-Line Transaction Processing联机事务处理系统 (OLTP) On-Line Analytical Processing联机分析处理系统 (OLAP) 比较实例——以商品采购为例 OLTP 描述一笔采购业务 模式:订单、订单细则、供应商 OLAP 关心采购渠道 按“供应商”重新组织数据 供应商基本信息:供应商号、供应商品、地址、电话 供应商品信息:供应商号、商品号、供应价、供应量、日期 大纲 进一步理解商业智能 商业智能在哪些行业中应用较广 数据仓库概要 OLAP概要 数据挖掘概要 数据挖掘概要 数据挖掘发展概述 数据挖掘的定义 数据挖掘的主要功能 数据挖掘的应用 数据、信息、知识和智慧 系统学专家Russell Ackoff博士认为人类大脑包涵的内容分为五类: 数据(Data):符号的集合,未加工、较为原始的形态 信息(Information):数据经过处理后,有意义的,具有利用价值的,能够回答4W(who what where when)等问题 知识(Knowledge):实践中产生、经过实践检验的一种客观规律,能够回答how的问题 智慧(Wisdom):人类基于已有的知识,?针对物质世界运动过程中产生的问题根据获得的信息进行分析,?对比,?演绎找出解决方案的能力。这种能力运用的结果是将信息的有价值部分挖掘出来并使之成为知识架构的一部分。能够回答why的问题。 数据挖掘的技术定义 数据挖掘(Data Mining) 从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 知识发现(Knowledge Discovery in Databases)是用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后隐藏的知识,成为数据库中的知识发现。 数

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档