网站大量收购闲置独家精品文档,联系QQ:2885784924

Hive数据仓库实践-2.pdf

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hive数据仓库实践-2

Hive数据仓库实践第2课 DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 法律声明 【声明】本视频和幻灯片为炼数成金网络课程的教学资料 ,所有资料只能在课程内使用,不得在课程以外范围散 播,违者将可能被追究法律和经济责任。 课程详情访问炼数成金培训网站 DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 第2课 Hive的基本概念与QuickStart DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 Hive简介  Hive是基于Hadoop的一个数据仓库工具  可以将结构化的数据文件映射为一张数据库表,并提供简单的类SQL(HQL)查询功能,可以将 HQL语句转换为MapReduce/Tez/Spark任务进行运行  学习成本低,可以通过类SQL语句快速实现简单的MR/Tez/Spark Job ,节省开发成本  适合数据仓库的ETL和统计分析  本课程基于CDH5.8.0的Hive版本(1.1.0-cdh5.8.0 ),仅支持Hive on MapReduce和Hive on Spark,以Hive on MapReduce为主 DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 Hive安装部署准备条件  OS : – Linux(RHEL ,CentOS ,SUSE, etc) – 本实验环境采用CentOS  JDK – 推荐用Oracle HotSpot (JDK6+ )  支持的Hadoop版本(1.x 2.x ): • 本实验环境版本2.6.0-cdh5.8.0  Hive版本: • 本实验环境版本1.1.0-cdh5.8.0 DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 Hive安装配置  MetaStore部署 • 支持derby/mysql/msserver/oracle/postgresql • 一般采用MySQL • 采用安装包自带的初始化脚本初始化  Hive安装包部署 • 安装包或者rpm包安装  配置文件 : • hive-env.sh (Hive环境变量相关) • hive-site.xml (Hive应用配置) DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 Hive初体验  进入CLI (敲hive命令)  输入HQL DATAGURU丏业数据分析社区 Hive数据仓库实践第一版 讲师朱广彬 Hive命令  不仅仅可以在CLI中输入HQL ,还支持command 命令 描述 quit /exit 退出Hive CLI set key=value 设置参数或配置变量 set 列出所有配置参数或变量 set -v

文档评论(0)

feixiang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档