- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
...
...
1 商务智能
数据仓库
数据仓库的 4 大特点(特征)?
面向主题的,集成的,相对稳定的,反映历史变化的。
数据仓库的四个层次体系结构?
数据源
是数据仓库系统的基础, 是整个系统的数据源泉。 通常包括企业内部信息和外部信
息。内部信息包括存放于 RDBMS中的各种业务处理数据和各类文档数据。外部信
息包括各类法律法规、市场信息和竞争对手的信息等等;
数据的存储与管理
是整个数据仓库系统的核心。 数据仓库的真正关键是数据的存储和管理。 数据仓库
的组织管理方式决定了它有别于传统数据库, 同时也决定了其对外部数据的表现形
式。要决定采用什么产品和技术来建立数据仓库的核心, 则需要从数据仓库的技术
特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照
主题进行组织。 数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数
据仓库(通常称为数据集市)
OLAP服务器
对分析需要的数据进行有效集成, 按多维模型予以组织, 以便进行多角度、 多层次
的分析,并发现趋势。 其具体实现可以分为: ROLA(P 关系型在线分析处理) 、MOLAP
(多维在线分析处理)和 HOLAP(混合型线上分析处理) 。ROLAP基本数据和聚合
数据均存放在 RDBMS 之中; MOLAP 基本数据和聚合数据均存放于多维数据库中;
HOLAP 基本数据存放于 RDBMS之中,聚合数据存放于多维数据库中。
前端工具
主要包括各种报表工具、 查询工具、 数据分析工具、 数据挖掘工具以数据挖掘及各
种基于数据仓库或数据集市的应用开发工具。 其中数据分析工具主要针对 OLAP 服
务器,报表工具、数据挖掘工具主要针对数据仓库。
描述一下联机分析处理 OLAP?(维的概念,基本多维
操作,层次结构,与 OLTP的区别)
OLAP(联机分析处理 On-Line Analytical Processing)也叫多维 DBMS。
OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直
观易懂的查询结果。
OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求 ,它的技术核
心是维这个概念。
“维”是人们观察客观世界的角度 ,是一种高层次的类型划分。 “维”一般包含着层次关
系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维
(dimension) ,使用户能对不同维上的数据进行比较。因此 OLAP也可以说是多维数据分析工
具的集合。也叫做多维数据集。一般一个多维数据集可以用一个立方体的方式进行描述。
多维数据集是联机分析处理 (OLAP) 中的主要对象, 是一项可对数据仓库中的数据进行
快速访问的技术。 多维数据集是一个数据集合, 通常从数据仓库的子集构造, 并组织和汇总
成一个由一组维度和度量值定义的多维结构。
每个多维数据集都有一个架构, 架构是数据仓库中已联接的各表的集合, 多维数据集从
数据仓库提取其源数据。 架构中的核心表是事实数据表, 事实数据表是多维数据集度量值的
源。
OLAP的基本多维分析操作有钻取( roll up 和 drill down )、切片( slice)和切块( dice)、
以及旋转( pivot)、drill across、drill through 等。· 钻取是改变维的层次,变换分析的粒度。
它包括向上钻取 (roll up )和向下钻取 (drill down )。roll up 是在某一维上将低层次的细节数
据概括到高层次的汇总数据,或者减少维数;而 drill down 则相反,它从汇总数据深入到细
节数据进行观察或增加新维。 · 切片和切块是在一部分维上选定值后,关心度量数据在剩余
维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。 · 旋转是变换维
的方向,即在表格中重新安排维的放置(例如行列互换) 。
多维数据集为什么显示有些表即是事实表又是维度
表?
退化维度。
描述一下粒度?维度? Cube?
粒度反映了数据仓库按照不同的层次组织数据, 根据不同的查询需要, 存储不同细节的
数据。在数据仓库中,粒度越小,数据越细,查询范围就越广泛。相反,粒度级别越高,表
示细节程度越低,查询范围越小。
描述一下 ODS,统一数据视图
运营数据存储 (The operational data store, ODS )或称操作型数据存储是一个面向主题的、
集成的、当前的并且是可 挥发的数据集合,它反映了在某一个时间切片瞬间,经营分析系
统和外围系统( BOSS、MIS...)用以相互交换数据的集合,主要用于经营分析系统与外围系
统关键数据一致性校验、 以及经营分析系统对其它外围系统的决策支持数据的
文档评论(0)