- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘技术第二章数据仓库
第2章 数据仓库
2.1数据仓库的基本概念
1. 数据仓库的数据是面向主题的
图2-1主题间的重叠关系
2. 数据仓库的数据是集成的
3. 数据仓库的数据是不可更新的
4. 数据仓库的数据是随时间不断变化的
图2-2数据仓库体系结构
2.2数据仓库的体系结构
图2-3数据仓库数据组织结构
2.2.1元数据
1. 元数据在数据仓库中的作用
2. 元数据的使用
3. 元数据的分类
4. 元数据的内容
2.2.2粒度的概念
1. 按时间段综合数据的粒度
2. 样本数据库
2.2.3分割问题
1. 分割的优越性
2. 数据分割的标准
3. 分割的层次
2.2.4数据仓库中的数据组织形式
1. 简单堆积结构
图2-4简单堆积结构数据组织形式
2. 轮转综合结构
图2-5轮转综合结构数据组织形式
3. 简单直接结构
图2-6简单直接结构数据组织形式
4. 连续结构
图2-7连续结构数据组织形式
2.3数据仓库的数据模型
2.3.1概念数据模型
图2-8商品、顾客和供应商E-R图
2.3.2逻辑数据模型
2.3.3物理数据模型
2.3.4高层数据模型、中间层数据模型和低层数据模型
1. 高层数据模型
2. 中间层数据模型
3. 低层数据模型
2.4数据仓库设计步骤
图2-9数据仓库设计步骤
2.4.1概念模型设计
1. 界定系统边界
2. 确定主要的主题域
3. 实例
2.4.2技术准备工作
2.4.3逻辑模型设计
1. 分析主题域
2. 划分粒度层次
3. 确定数据分割策略
4. 定义关系模式
5. 定义记录系统
2.4.4物理模型设计
1. 确定数据的存储结构
2. 确定索引策略
3. 确定数据存放位置
4. 确定存储分配
2.4.5数据仓库的生成
1. 接口设计
2. 数据装入
2.4.6数据仓库的使用和维护
1. 开发DSS应用
图2-10DSS应用开发步骤
2. 进一步理解需求,改善系统,维护数据仓库
图2-11William H.Inmon数据仓库设计步骤
2.5利用SQL Server 2005构建数据仓库
图2-12使用Visual Studio 2005系统新建项目
图2-13新建Analysis Services项目
图2-14新建数据源
图2-15新建数据源向导
图2-16选择如何连接数据源
图2-17连接管理器
图2-18连接管理器连接测试成功窗口
图2-19选择已经连接的数据库作为数据源
图2-20选择连接数据源的凭证
图2-21新建数据源向导完成
图2-22右击新建数据源视图
图2-23新建数据源视图向导
图2-24选择视图的数据源
图2-25选择表和视图
图2-26完成新建数据源视图向导
图2-27新建多维数据集
图2-28多维数据集向导
图2-29选择生成多维数据集的方法
图2-30选择多维数据集的数据源视图
图2-31检测事实数据表和维度表
图2-32标示事实表和维度表
图2-33选择度量值
图2-34扫描维度
图2-35查看维度结构
图2-36完成多维数据集向导
图2-37创建完成数据仓库界面
习题2
1. 如何理解数据仓库是面向主题的、集成的、不可更改的和是随时间不断变化的。
2. 什么叫元数据?起什么作用?
3. 如何理解数据仓库中的粒度的概念?如何确定数据仓库的粒度?数据量与粒度有什么关系?
4. 为什么要进行数据仓库的清理?如何清理?
5. 数据仓库设计有哪3级数据模型?各如何设计?
6. 采用什么方法可以提高数据仓库的性能?
7. 叙述数据仓库设计的具体步骤,如何实现?
8. 什么是数据仓库的直接访问,什么是数据仓库的间接访问?两者有何不同?
9. 数据仓库有哪些应用领域?各举例说明。
1
数据结构(C++版)
数据仓库与数据挖掘技术
您可能关注的文档
- 教育课题研究的四个意义和五个环节教育科研课题行动备要.doc
- 教育类职业道德与创新能力试题及答案.doc
- 教资国考《综合素质(幼儿)》考前提分卷及答案(一).doc
- 教资模拟题.doc
- 散热器安装技术交底007.doc
- 数值传热第六章作业.doc
- 数值计算实验5.doc
- 数值计算方法第七章习题2013.doc
- 数列例题2(含答案).doc
- 数制编码与通信第1讲.doc
- 2025年金肯职业技术学院单招职业适应性测试题库带答案.docx
- 2025年钦州幼儿师范高等专科学校单招综合素质考试题库完美版.docx
- 2025年钟山职业技术学院单招职业适应性考试题库参考答案.docx
- 2025年金华职业技术学院单招职业技能测试题库附答案.docx
- 2025年闽南理工学院单招职业技能测试题库审定版.docx
- 2025年闽南理工学院单招综合素质考试题库审定版.docx
- 2025年闽南理工学院单招职业倾向性考试题库汇编.docx
- 2025年闽南理工学院单招职业倾向性考试题库推荐.docx
- 2025年闽北职业技术学院单招综合素质考试题库1套.docx
- 2025年长沙轨道交通职业学院单招职业技能考试题库一套.docx
最近下载
- 工业机器人安装与调试技术PPT(高职)全套全套教学课件.pptx VIP
- 2023年青海师范大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案).docx VIP
- 青海师范大学《算法设计与分析实验》2021-2022学年期末试卷.doc VIP
- 《甲状腺的超声检查》ppt课件.ppt VIP
- 甲状腺超声检查课件.ppt VIP
- 规范甲状腺超声检查培训课件.pptx VIP
- 青海师范大学《算法设计与分析》2022-2023学年期末试卷.doc VIP
- 创新思维与能力培养课件.ppt VIP
- 规范甲状腺超声检查.PPT VIP
- 青海师范大学《算法设计与分析》2021-2022学年期末试卷.doc VIP
文档评论(0)