- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
授课日期上课节次1课型理论
课题数据仓库基础
教学目的了解什么是数据仓库,和数据库有什么区别
重点、难点无
主要内容教学方法时间分配
与手段
1、讲解关系型数据库
举例讲解30分钟
1)数据库三范式
2)数据库事务
3)数据库设计理念
数据库的设计理念是基于事务的,它在企业应用的过程中起到
的作用是为用户提供即时服务。举例讲解30分钟
2、讲解数据仓库
数据仓库是一个面向主题的、集成的、随时间变化的、但信息
本身相对稳定的数据集合,用于对管理决策过程的支持。
面向主题:数据仓库都是基于某个明确主题,仅需要与该主题
相关的数据,其他的无关细节数据将被排除掉。
集成的:从不同的数据源采集数据到同一个数据源,此过程会
有一些ETL操作。
随时间变化:关键数据隐式或显式的基于时间变化。
数据仓库的数据是不可更新的:数据装入以后一般只进行查询
操作,没有传统数据库的增删改操作。
数据仓库的数据反映的是一段相当长的时间内历史数据的内
容,是不同时点的数据库快照的集合,以及基于这些快照进行
统计、综合和重组的导出数据,而不是联机处理的数据。
讲解20分钟
3、数据库与数据仓库的区别
1)数据库bai是面向事务的设计,数据仓库是面向主题设计的。
2)数据库一般存储在线交易数据,数据仓库存储的一般是历史
数据。
3)数据库是面向事务的设计,数据仓库是面向主题设计的。数
据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
4)数据库设计是尽量避免冗余,一般采用符合范式的规则来设
计,数据仓库在设计是有意引入冗余,采用反范式的方式来设
计。
5)数据库是为捕获数据而设计,数据仓库是为分析数据而设计,
它的两个基本的元素是维表和事实表。
教学后记
授课日期上课节次2课型理论
课题Hive的安装部署
教学目的掌握Hive的安装部署
重点、难点Hive的安装部署
主要内容教学方法时间分配
与手段
1、Hive安装部署讲解10分钟
Hive本身是建立在Hadoop体系结构上的数据仓库基础构架,
可以将结构化的数据文件映射为一张数据库表,并提供完整的
ql语句,把ql语句转化成mapreduce程序提交给hadoop集群
完成相关任务。
1)上传软件至/usr/local目录,解压并修改名称现场安装80分钟
tar-zxvfhive-0.13.1-cdh5.3.6.tar.gz-CHive
/usr/local
#解压后因为文件名较长,可以修改安装目录,命令如下:
mvhive-0.13.1-cdh5.3.6hive
2)配置Hive环境变量。具体实现命令如下:
#修改.bashrc文件
vi~/.bashrc
#.bashrc文件内容
exportHIVE_HOME=/root/bigdata/hive
exportPATH=$PATH:$HIVE_HOME/bin
source
文档评论(0)