- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
据仓库设计
商业智能核心技术与应用
数据仓库设计
数据仓库的基本概念
数据仓库是面向主题的、集成的、稳定的、随时间不断变化的数据库系统。它介于数据源与多维数据库之间,起到承上启下的作用。
数据仓库是通过对来自不同的数据源进行统一处理及管理,通过灵活的展现方法来帮助决策支持。
数据仓库的设计理念
在设计仓库数据库之初把用户的分析需求纳入考虑范围是十分有必要的。同时,数据仓库的构建必需基于业务数据库,业务数据源的结构也是不得不考虑的问题。因此在设计数据仓库的时候,应该坚持用户驱动与数据驱动相结合的设计理念。
业务数据模型设计的设计范式
1NF
如果一个表中没有重复组(即行与列的交叉点上只有一个值,而不是一组值),且定义了关键字、所有 非关键属性都依赖于关键字,则这个表属于第一范式(常记成1NF)
2NF
如果一个表属于1NF,且不包含部分依赖性,既没有任何属性只依赖于关键字的一部分,则这个表属于第二范式(常记成2NF )。
3NF
如果一个表属于2NF,且不包含传递依赖性(即没有一个非关键属性依赖于另一个非关键属性,或者说没有一个非关键属性决定另一个非关键属性),则这个表是第三范式(常记成3NF)。
业务数据模型设计的ER图表示
ER模型(实体联系模型)简称ER图。它是描述概念世界,建立概念模型的实用工具。
ER图包括三个要素:实体、属性、实体之间的联系
联系归结为三种类型:
一对一联系(1:1) 设A、B为两个实体集。若A中的每个实体至多和B中的一个实体有联系,反过来,B中的每个实体至多和A中的一个实体有联系,称A对B或B对A是1:1联系。
一对多联系(1:n) 如果A实体集中的每个实体可以和B中的几个实体有联系,而B中的每个实体至我和A中的一个实体有联系,那么A对B属于1:n联系。
多对多联系(m:n) 若实体集A中的每个实体可与和B中的多个实体有联系,反过来,B中的每个实体也可以与A中的多个实体有联系,称A对B或B对A是m:n联系。
多对多联系举例
统计特征
Fat
Lean
Ugly
Wealthy
客户
统计特征
John
Fat
Richard
Lean
John
Ugly
Richard
Wealthy
客户
John
Richard
Cristian
客户
销售额
John
1.0
Richard
3.0
Cristian
10.0
每个统计特征对销售人员来说是怎么样的呢?
统计特征
销售额
All Demographics
14.0
Fat
1.0
Lean
3.0
Ugly
1.0
Wealthy
3.0
数据仓库模型设计最佳实践
数据仓库模型设计主要分三个阶段:
1、概念设计
2、逻辑设计
3、详细设计
并分别产生三类设计模型
1、主题域模型
2、业务数据模型
3、物理模型
8
数据仓库模型设计采用迭代式开发,这一点也符合数据仓库系统迭代开发的特点。它具有较好的灵活性和易变性,适应于主题不明确或不确定的需求。
概念设计
数据仓库是面向主题来组织数据,一个数据仓库有若干个主题,而每个主题又有一个数据集合体做支撑,这个数据集合称为主题域。
概念设计的中心工作是在需求分析基础上设计的主题域模型。主体域模型是客观到主观之间的桥梁,是与硬件环境、软件选择无关的数据抽象模型,是为下一步建立业务数据模型、物理模型服务的概念性工具。
主题域具有两个特性
1、独立性,即主题域具有明确的边界与独立的内涵,虽然主题间可以有交叉,但不影响其独立性。
2、完备性,即每个主题的分析要求所需的数据均应能在主题域中得到。采用概念数据模型设计就是要设计主题域的数据结构。
数据仓库项目的主题域模型示例
逻辑设计
逻辑设计设计到的知识点包括:
业务数据模型设计的建模对象应包含实体、属性、关键字和联系。
业务数据模型设计应该遵守规范化准则:即第三范式设计准则。
业务数据模型的ER图表示法。
逻辑设计的中心工作是设计业务数据模型,业务数据模型是用具体的软件结构来实现概念数据模型。
目前数据仓库一般是建立在关系数据库基础上,因此数据仓库的设计中采用的业务数据模型就是关系模型。
业务数据模型设计的建模对象
实体
我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。
属性
描述实体的特性称为属性。
关键字
如果某个属性值能唯一地标识出实体集中的每一个实体,可以选作关键字。
联系
实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。
逻辑设计方法—定义实体
主题域
主题
实体
粒度
类型
说明
生
您可能关注的文档
- 惠州展通丰田车间.doc
- 成分及烧结工艺对锯片锋利性的影响.pdf
- 成品仓储管理规定.doc
- 成品入库流程-复读机.ppt
- 德马格WMS仓库管理系统操作说明.pdf
- 慧欣机车公司车间安全培训20126改.ppt
- 成品入库报表.doc
- 徐州维维六朝松面粉厂仓储管理.ppt
- 成品库副科长.doc
- 情境一安全生产与车床基本知识110718.ppt
- 2024年江西省高考政治试卷真题(含答案逐题解析).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)物理试卷(含答案详解).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解).pdf
- 2024年内蒙通辽市中考化学试卷(含答案逐题解析).docx
- 2024年四川省攀枝花市中考化学试卷真题(含答案详解).docx
- (一模)长春市2025届高三质量监测(一)化学试卷(含答案).pdf
- 2024年安徽省高考政治试卷(含答案逐题解析).pdf
- (一模)长春市2025届高三质量监测(一)生物试卷(含答案).pdf
- 2024年湖南省高考政治试卷真题(含答案逐题解析).docx
- 2024年安徽省高考政治试卷(含答案逐题解析).docx
文档评论(0)