- 1
- 0
- 约6.18千字
- 约 55页
- 2019-03-24 发布于安徽
- 举报
逻辑模型设计——雪花模型 在该模型中,将地理层次国家、区域和分区域嵌入到销售员维度,这样,公司的管理者想按照国家、区域、分区域和分区域内的销售员的层次关系来查看公司的销售情况。 销售数据仓库逻辑模型(雪花型) 3)星座模型 一个复杂的商业智能应用往往会在数据仓库中存放多个事实表,这时就会出现多个事实表共享某一个或多个维表的情况,这就是事实星座,也称为星系模型(galaxy schema)。 数据仓库由于是企业范围的,能对多个相关的主题建模,所以在设计其数据构成时一般采用星系模式。而数据集市是部门级的,具有选定的主题,可以采用星形或雪花模型。 4)维度的设计 维是人们观察客观世界的角度,是一种高层次的类型划分。如:对客户、产品、服务、提供商、地点、渠道和事件发生的时间 维表是由维主键和维属性组成的 一般情况下,在每次抽样时,如果数值数据字段的度量都改变,那么它就是事实,如果它是某种东西的离散值描述,并几乎保持为常数,那么它就是维属性。例如,商品的价格是维表的属性,销售量是事实。 维表举例 时间维度及其层次关系 财务时间维度 维表举例 地理维度层次 机构维度层次 维表举例 客户维度分类 3. 物理模型设计 数据仓库的物理数据模型就是逻辑数据模型在数据仓库中的实现,如: 物理存取方式 数据存储结构 数据存放位置以及存储分配等 物理数据模型设计实现时,所考虑的主要因素有: I/O存取时间 空间利用率和维护代价 物理模型设计——设计存储结构 在物理设计时,常常要按数据的重要性、使用频率及对反应时间的要求进行分类,并将不同类型的数据分别存储在不同的存储设备中。 重要性高、经常存取并对反应时间要求高的数据存放在高速存储设备上; 存取频率低或对存取响应时间要求低的数据则可以存放在低速存储设备上。 4.3 数据仓库的粒度设计 数据仓库的性能和存储空间是一对矛盾。 如果粒度设计得很小,则事实表将不得不记录所有的细节,储存数据所需要的空间将会急剧的膨胀; 若设计的粒度很大,决策者不能观察细节数据。 粒度设计的三个步骤 粗略估计 确定双重还是单一粒度 确定粒度的级别 4.4 创建数据仓库的基本步骤 (1) 收集运营环境文档。 (2) 选择数据仓库的实现技术。 (3) 设计数据仓库模型。 (4) 创建数据准备区。 (5) 创建数据仓库数据库。 (6) 从操作型系统中抽取数据。 (7) 清理和转换数据。 (8) 将数据载入数据仓库数据库。 (9) 准备显示数据。 (10) 将数据分发到数据集市。 建立运营环境文档 建立运营环境的第一步是识别所有业务系统 确定每个系统中存储什么样的数据 选择数据仓库的实现技术 (1) 数据仓库的操作系统。 (2) 数据仓库的数据库。 (3) 数据仓库模型工具。 (4) 数据仓库开发工具。 (5) 数据仓库监视工具。 (6) 提取和清除工具。 (7) 报告工具。 (8)??OLAP服务器。 (8) 数据挖掘工具 选择数据仓库的实现技术 下面是选择供应商需要注意的问题。 (1) 选择“最好的”产品并不总是正确的解决方案。 (2) 选择与行业标准相近的产品。 花费时间来评估几个供应商的不同软件包是一件非常迫切需要的工作。 设计数据仓库模型 关系模型是当前最流行数据模型 最流行的数据仓库模型是星型模型。 创建数据准备区 为支持数据抽取、清理和转换操作以便准备数据装入数据仓库,需要创建表和其他数据库对象。 可以为数据准备区创建单独的数据库,或者可以在数据仓库数据库中创建这些项目。 数据准备区应包括包含传入数据的表、帮助实现代理键的表以及容纳转换数据的表。 数据准备区的特定设计取决于数据源的多样性、组织数据,以使在装入数据仓库时所需的转换程度以及传入数据的一致性。 创建数据仓库数据库 创建事实数据表和维度表,并在所有表中的主要字段上建立索引。 星型架构由单个事实数据表和一些维度表组成。雪花型架构增加了次要维度表。 从操作型系统中抽取数据 抽取数据 简单抽取 复杂抽取 识别数据中的错误和不一致问题。 清理和转换数据 从源系统抽取后,数据应驻留在数据准备区,在这里可以在数据装入数据仓库前完成清理和转换。 可以执行一些过程来验证数据的一致性,将数据转换成常用格式以及合并代理键。 可能需要执行手工操作协调数据的不一致或解决二义性文本字段输入项 将数据装入数据仓库数据库 在数据被清洗、转换之后,就可将数据加载到合适的数据仓库事实表中。 在数据加载后,还要更新元数据仓库中的元数据,以反映刚完成的数据加载活动,并且对受影响的概括数据重新概括处理。 教学要求 知识要点 能力要求 相关知识点
您可能关注的文档
- _肿瘤免疫治疗临床应用和进展.ppt
- “高投入高成本”的厕所建造和运营模式.ppt
- 4磁共振常见伪影和解决方案.ppt
- 4媒体推广排期计划营销策划中心.ppt
- 8_无锡盛高策划.ppt
- 8D方法培训资料全.ppt
- 8D改善措施报告.ppt
- 2016.12经腹直肠癌根治术的护理_查房.ppt
- 2016ESC急性心衰指南.ppt
- 2016成都成华区龙潭地块初步研判.ppt
- 七年级语文上册期末模拟试卷1(解析版).docx
- 七年级语文上册期末模拟试卷1(原卷版).docx
- 七年级语文上册期末模拟试卷2(原卷版).docx
- 七年级语文上册期末模拟试卷2(解析版).docx
- 期末测试卷(二)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(三)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(二)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(三)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(一)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(一)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
原创力文档

文档评论(0)