OLAP与数据仓库设计实验报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OLAP与数据仓库设计实验报告 姓名 专业 软件与服务工程 学号 实验日期 11/11 实验简要说明 本次试验是为了完成数据仓库中维度表的ETL处理。 教师评分 实验目的 本次试验主要是将样例数据库中的数据装载到数据仓库中,这里使用ETL工具——Kettle。本次试验须完成维度表的装载。 实验环境 本次试验需要如下环境: 1)计算机要求: 操作系统:不限,可以使windows也可以是Linux。 内存:建议大于512M。 硬盘:30G及其以上。 2)数据库方面要求: 数据库采用mysql,数据仓库也采用mysql完成。 ETL工具要求: 这里采用开源ETL工具Kettle。 实验任务 将样例数据库中的数据经过ETL过程装载到数据仓库中,主要是完成维度表格的装载。提交完成的转换和job。 实验步骤 一、title维度表转换 1、首先把mysql-connector-java-5.1.15-bin.jar文件放到pentaho/pdi-ce-5.1.0.0-752/data-integration/lib文件夹中,然后点击set-pentaho-env.bat设置环境,在点击Spoon.bat运行,如下图所示: 2、将employees样例数据导入到数据库employees中,在MySQL中新建一个数据库test,并按照实验三给出的星型模型在test中建立employee,department,title,time,salaries这五张表,并按照实验三的要求预先确定变之间的关系,结构如下图所示: 3、在spoon中新建一个“title转换”,在其中加入一个“表输入”对象“employees-titles表输入”对其进行如下设置: 在“数据库连接”处点击新建,如下设置,点击测试,成功后确认。 4、加入一个“增加序列”对象以保证title表中的title_key是自增的,设置如下: 5、加入一个“表输出”对象“test-title表输出”,如下设置: 在“数据库连接处”点击新建,如下设置: 6、连接各个对象如下图所示: 点击执行,“步骤度量”如下图显示: 查看test数据库的title表,如下图所示: 二、department维度表转换 1、新建一个转换“emp转换”,添加一个“表输入”对象“employees-dep表输入”,如下图所示: 在“数据库连接”处点击新建,如下图所示配置: 2、加入“字段选择”对象,做如下设置: 3、加入“增加序列”对象,进行如下设置; 4、添加一个“表输出”对象“test-dept表输出”,进行如下配置: 在“数据库连接”处点击新建,如下配置: 5、将各个对象连接起来,获得如下结果: 点击运行,则在“步骤度量”里显示运行成功: 查看数据库test的deptment表,结果显示如下: 三、employee维度表转换 1、新建一个“emptrans”转换,在其中加入“表输入”对象“employees-emp表输入”,其设置如下图所示: 点击“数据库连接”出的新建,配置如下: 2、加入一个“增加序列”对象,进行如下设置: 3、加入“值映射”对象,进行如下设置: 4、加入“表输出”对象“test-emp表输出”,如下图设置: 点击“数据库连接”处的新建,建立如下连接: 将各个对象连接起来获得如下结果: 数据库显示结果如下: 四、time维度表转换 由于时间是连续的,这里选择用java连接MySQL数据库,直接将1085年到2014年之间的所有日期都导入到test数据库的time维度表中,代码如下所示: package ymd; import java.sql.*; public class myTest { //声明Connection对象 Connection con; Statement st; //驱动程序名 String driver = com.mysql.jdbc.Driver; //URL指向要访问的数据库名test String url = jdbc:mysql://localhost:3306/test; //MySQL配置时的用户名 String user = root; //MySQL配置时的密码 String password = 1qaz2wsx; int year=1985; int month; int day; public void setConnection() throws Exception { try { Class.forName(driver); con = DriverManager.getCon

文档评论(0)

ze122230743 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档