- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
商务智能
数据仓库
数据仓库的4大特点(特性)?
面向主题的,集成的,相对稳定的,反映历史变化的。
数据仓库的四个层次体系结构?
数据源
是数据仓库系统的基础,是整个系统的数据源泉。通常涉及公司内部信息和外部信息。内部信息涉及存放于RDBMS中的各种业务解决数据和各类文档数据。外部信息涉及各类法律法规、市场信息和竞争对手的信息等等;
数据的存储与管理
是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为公司级数据仓库和部门级数据仓库(通常称为数据集市)
OLAP服务器
对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP(关系型在线分析解决)、MOLAP(多维在线分析解决)和HOLAP(混合型线上分析解决)。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。
前端工具
重要涉及各种报表工具、查询工具、数据分析工具、数据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具重要针对OLAP服务器,报表工具、数据挖掘工具重要针对数据仓库。
描述一下联机分析解决OLAP?(维的概念,基本多维操作,层次结构,与OLTP的区别)
OLAP(联机分析解决On-LineAnalyticalProcessing)也叫多维DBMS。
OLAP是数据仓库系统的重要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
OLAP的目的是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是维这个概念。
“维”是人们观测客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,这种层次关系有时会相称复杂。通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。因此OLAP也可以说是多维数据分析工具的集合。也叫做多维数据集。一般一个多维数据集可以用一个立方体的方式进行描述。
多维数据集是联机分析解决(OLAP)中的重要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。
每个多维数据集都有一个架构,架构是数据仓库中已联接的各表的集合,多维数据集从数据仓库提取其源数据。架构中的核心表是事实数据表,事实数据表是多维数据集度量值的源。
OLAP的基本多维分析操作有钻取(rollup和drilldown)、切片(slice)和切块(dice)、以及旋转(pivot)、drillacross、drillthrough等。·钻取是改变维的层次,变换分析的粒度。它涉及向上钻取(rollup)和向下钻取(drilldown)。rollup是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drilldown则相反,它从汇总数据进一步到细节数据进行观测或增长新维。·切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。假如剩余的维只有两个,则是切片;假如有三个,则是切块。·旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
多维数据集为什么显示有些表即是事实表又是维度表?
退化维度。
描述一下粒度?维度?Cube?
粒度反映了数据仓库按照不同的层次组织数据,根据不同的查询需要,存储不同细节的数据。在数据仓库中,粒度越小,数据越细,查询范围就越广泛。相反,粒度级别越高,表达细节限度越低,查询范围越小。
描述一下ODS,统一数据视图
运营数据存储(Theoperationaldatastore,ODS)或称操作型数据存储是一个面向主题的、集成的、当前的并且是可挥发的数据集合,它反映了在某一个时间切片瞬间,经营分析系统和外围系统(BOSS、MIS...)用以互相互换数据的集合,重要用于经营分析系统与外围系统关键数据一致性校验、以及经营分析系统对其它外围系统的决策支持数据的回馈,回馈数据涉及以客户扩展属性为主体的具体资料等。运营数据存储扮演的是用于数据稽核与交互的角色。
ODS的存储结构是以公司范围所有相关业务系统的数据,以全面、统一进行关系型实体来体现的,ODS中的数据是基于分析主题进行组织,而不是基于业务系统的功能进行组织。O
您可能关注的文档
- 2023年江苏省高等教育自学考试成本会计试卷.doc
- 2023年全国保险代表人从业人员资格考试卷A卷.doc
- 光合作用的探究历程.ppt
- 七巧板全国劳技课大.ppt
- 2023年下半年广西证券从业资格考试政府债券考试试题.docx
- 你来比划我来猜词语搞笑版.ppt
- 2023年计算机三级嵌入式系统真题及答案.doc
- 2024年宠物医院项目投资分析及可行性报告.docx
- 中小企业会计制度设计的探讨.docx
- fMRI技术原理基础研究与临床应用.pptx
- 2021海湾消防GST-HX-420BEx 火灾声光警报器安装使用说明书.docx
- 2022海湾消防 GST-LD-8316Ex 手自动转换装置安装使用说明书.docx
- (小升初押题卷)江苏省小升初重难点高频易错培优卷(试题)-2024-2025学年六年级下册数学苏教版.docx
- 2023-2024学年吉林省吉林市舒兰市人教版四年级上册期末考试数学试题.docx
- 2023-2024学年北京市密云区北京版四年级上册期末考试数学试卷.docx
- 2024-2025学年广东省广州市天河区人教版三年级上册期末考试数学试卷.docx
- 2024-2025学年河北省唐山市丰南区人教版五年级上册期末测试数学试卷.docx
- 人教版道德与法治一年级下册第4课《我们有精神》课件.pptx
- 消防蝶阀介绍.pptx
- 室外消火栓设置场所及设置要求.pptx
文档评论(0)