- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
昆明理工大学信息工程与自动化学院学生实验报告
( 2015 — 2016 学年 第 1 学期 )
课程名称:数据库仓库与数据挖掘 开课实验室:信自楼234 2015年11月12日
年级、专业、班
计科122
学号
201210405204
姓名
邹华宇
成绩
实验项目名称
实验一 数据仓库的构建
指导教师
周海河
教师评语
该同学是否了解实验原理: A.了解□ B.基本了解□ C.不了解□
该同学的实验能力: A.强 □ B.中等 □ C.差 □
该同学的实验是否达到要求: A.达到□ B.基本达到□ C.未达到□
实验报告是否规范: A.规范□ B.基本规范□ C.不规范□
实验过程是否详细记录: A.详细□ B.一般 □ C.没有 □
教师签名:
年 月 日
一、实验目的、内容与要求
目的:1.理解数据库与数据仓库之间的区别与联系;
2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法;
3.掌握数据仓库建立的基本方法及其相关工具的使用。
内容:以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。
要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。
二、实验原理及基本技术路线图(方框原理图)
数据库(DataBase,DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小的冗余度、数据间联系紧密而又有较高的数据独立性等特点。构成的三要素是数据结构、数据操作、约束性条件。
数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的数据形成当前基本数据层,经过综合后形成轻度综合数据层,轻度综合数据再经过综合后形成高度综合数据层。数据仓库结构包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。
数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,结构形式如下图所示:
关系数据库数据文件
关系数据库
数据文件
其他数据
数据建模
抽取、转换
装载(ETL)
元数据
系统管理
综合数据
当前数据
历史数据
查询工具
OLAP工具
DM工具
C/S工具
数据仓库的逻辑数据模型是多维结构的数据视图,也称多维数据模型。对于逻辑数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。
ETL过程在开发数据仓库时,占去70%的工作量。ETL过程的主要步骤概括为:
(1)决定数据仓库中需要的所有的目标数据;
(2)决定所有的数据源,包括内部和外部的数据源;
(3)准备从源数据到目标数据的数据映射关系;
(4)建立全面的数据抽取规则;
(5)决定数据转换和清洗规则;
(6)为综合表制定计划;
(7)组织数据缓冲区域和检测工具;
(8)为所有的数据装载编写规程;
(9)维度表的抽取、转换和装载;
(10)事实表的抽取、转换和装载。
三、所用仪器、材料(设备名称、型号、规格等)
操作系统平台:Win 7
数据库平台:Microsoft SQL Server 2008
四、实验方法、步骤
本次实验使用Microsoft SQL Server的示例数据库Adventure Works,用其用户订单模型相关数据建立数据仓库。
Adventure Works由来:Adventure Works Cycles,Adventure Works示例数据库所基于的虚构公司,是一家大型跨国生产公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。
1、登录Microsoft SQL Server 2008
登录名:localhost
2、使用SQL语句构建数据库
(1)还原数据库
(2)建立数据
--建立数据
USE cd
CREATE DATABASE [DW] ON PRIMARY
( NAME = NDW, FILENAME
您可能关注的文档
- 园林绿化景观工程资料表格汇总六.doc
- 浙江高新技术企业全面风险管理评价研究浙江科技厅.doc
- 用kpi营销培训有效规避培训风险.doc
- 支付业务设施技术安全认证实施规则中金国盛.doc
- 注册咨询工程师考试工程项目组织与管理真题及答案.doc
- 某村扶贫项目竞标书建立水果气调保鲜库项目范文.docx
- 最新人力资源控制程序.doc
- 汇总6版本预算员岗位职责说明书预算部经理岗位职责说明书.docx
- 最新文件管理控制程序配流程图.doc
- 拌合站规划和建设方案分析.doc
- 五个管好的意识形态工作总结.docx
- 在学校党员大会上的讲话:今年国际教育发展的四个主题.docx
- 在区廉政谈话会上的讲话.docx
- 学习贯彻2024年中央经济工作会议精神 打好政策“组合拳”保持经济稳定增长.pptx
- (7篇)学习贯彻中央经济工作会议精神研讨发言心得体会汇编.docx
- 关于“时代新人”视阈下高职思政课教学实践探究报告.docx
- (2025.01.05)关于城市营商环境现状与优化路径探索报告.docx
- 教育工作会议主题发言材料和讲话材料汇编(6篇).docx
- 镇党委副书记兼派出所所长关于2024年度民主生活会个人对照查摆剖析材料.docx
- 县委常委班子2024年度民主生活会对照检查.docx
最近下载
- 2023年广东省普通高中学业水平考试生物试卷.pdf VIP
- 中国复合铜箔行业市场全景评估及投资前景展望报告.docx
- 《广药南药》ppt模板课件.ppt
- 统编版高中历史选择性必修2 《经济与社会生活》思考点、学思之窗、问题探究习题答案.doc
- (精选)附表1软硬件及机房建设需求配置表.pdf VIP
- 2024年中考语文试题分类汇编:一般记叙文阅读(第03期)含答案及解析.pdf VIP
- 项目部安全生产隐患排查治理行动方案.docx VIP
- 安徽省合肥市包河区2023-2024学年七年级上学期期末历史试题.docx VIP
- 部编版六年级上册第七单元语文园地表艺术的词语释义和例句.docx
- 水泥厂日产300吨窑尾预热器与分解炉设计.doc
文档评论(0)