网站大量收购闲置独家精品文档,联系QQ:2885784924

数据仓库与数据挖掘实验一数据仓库的构建.docVIP

数据仓库与数据挖掘实验一数据仓库的构建.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
昆明理工大学信息工程与自动化学院学生实验报告 ( 2015 — 2016 学年 第 1 学期 ) 课程名称:数据库仓库与数据挖掘 开课实验室:信自楼234 2015年11月12日 年级、专业、班 计科122 学号 201210405204 姓名 邹华宇 成绩 实验项目名称 实验一 数据仓库的构建 指导教师 周海河 教师评语 该同学是否了解实验原理: A.了解□ B.基本了解□ C.不了解□ 该同学的实验能力: A.强 □ B.中等 □ C.差 □ 该同学的实验是否达到要求: A.达到□ B.基本达到□ C.未达到□ 实验报告是否规范: A.规范□ B.基本规范□ C.不规范□ 实验过程是否详细记录: A.详细□ B.一般 □ C.没有 □ 教师签名: 年 月 日 一、实验目的、内容与要求 目的:1.理解数据库与数据仓库之间的区别与联系; 2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法; 3.掌握数据仓库建立的基本方法及其相关工具的使用。 内容:以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。 二、实验原理及基本技术路线图(方框原理图) 数据库(DataBase,DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小的冗余度、数据间联系紧密而又有较高的数据独立性等特点。构成的三要素是数据结构、数据操作、约束性条件。 数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的数据形成当前基本数据层,经过综合后形成轻度综合数据层,轻度综合数据再经过综合后形成高度综合数据层。数据仓库结构包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。 数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,结构形式如下图所示: 关系数据库数据文件 关系数据库 数据文件 其他数据 数据建模 抽取、转换 装载(ETL) 元数据 系统管理 综合数据 当前数据 历史数据 查询工具 OLAP工具 DM工具 C/S工具 数据仓库的逻辑数据模型是多维结构的数据视图,也称多维数据模型。对于逻辑数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。 ETL过程在开发数据仓库时,占去70%的工作量。ETL过程的主要步骤概括为: (1)决定数据仓库中需要的所有的目标数据; (2)决定所有的数据源,包括内部和外部的数据源; (3)准备从源数据到目标数据的数据映射关系; (4)建立全面的数据抽取规则; (5)决定数据转换和清洗规则; (6)为综合表制定计划; (7)组织数据缓冲区域和检测工具; (8)为所有的数据装载编写规程; (9)维度表的抽取、转换和装载; (10)事实表的抽取、转换和装载。 三、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Win 7 数据库平台:Microsoft SQL Server 2008 四、实验方法、步骤 本次实验使用Microsoft SQL Server的示例数据库Adventure Works,用其用户订单模型相关数据建立数据仓库。 Adventure Works由来:Adventure Works Cycles,Adventure Works示例数据库所基于的虚构公司,是一家大型跨国生产公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。 1、登录Microsoft SQL Server 2008 登录名:localhost 2、使用SQL语句构建数据库 (1)还原数据库 (2)建立数据 --建立数据 USE cd CREATE DATABASE [DW] ON PRIMARY ( NAME = NDW, FILENAME

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档