- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HIVE安装使用说明
HIVE安装使用说明
Hive简介
Hive是什么
Hadoop作为分布式运算的基础架构设施,统计分析需要采用MapReduce编写程序后,放到Hadoop集群中进行统计分析计算,使用起来较为不便,Hive产品采用类似SQL的语句快速实现简单的MapReduce统计,很大程度降低了Hadoop的学习使用成本。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供基础的SQL查询功能,可以将SQL语句转换为MapReduce任务运行,而不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
部署架构
Hive中的Driver为核心驱动部分,包括SQL语句的解释、编译为MapReduce任务,并进行优化、执行。
Hive用户访问包括4种运行和访问方式,一是CLI客户端;二是HiveServer2和Beeline方式;三是HCatalog/WebHCat方式;四是HWI方式。
其中CLI、Beeline均为控制台命令行操作模式,区别在于CLI只能操作本地Hive服务,而Beeline可以通过JDBC连接远程服务。
HiveServer2为采用Thrift提供的远程调用接口,并提供标准的JDBC连接访问方式。
HCatalog是Hadoop的元数据和数据表的管理系统,WebHCat则提供一条Restful的HCatalog远程访问接口,HCatalog的使用目前资料很少,尚未充分了解。
HWI是Hive Web Interface的简称,可以理解为CLI的WEB访问方式,因当前安装介质中未找到HWI对应的WAR文件,未能进行使用学习。
Hive在运行过程中,还需要提供MetaStore提供对元数据(包括表结构、表与数据文件的关系等)的保存,Hive提供三种形式的MetaStore:一是内嵌Derby方式,该方式一般用演示环境的搭建;二是采用第三方数据库进行保存,例如常用的MySQL等;三是远程接口方式,及由Hive自身提供远程服务,供其他Hive应用使用。在本安装示例中采用的第二种方式进行安装部署。
备注:在本文后续的安装和说明中,所有示例均以HiverServer2、Beeline方式进行。
另:因Hive在查询时性能较差,后期拟计划采用SPARK或Presto进行替代,因此本安装手册不对Hive的集群方案进行描述。
环境说明
本安装示例在Ubuntu 14.04.3的虚拟器中进行安装,并提前安装配置Hadoop。
机器名 IP地址 安装软件 启用服务 hdfs1 84 Hive
Hadoop hdfs2 82 Hadoop hdfs3 83 MySQL
Hadoop MySQL安装配置
2.1. MySQL安装
登录到hdfs3中,安装MySQL服务器。
$ sudo apt-get install mysql-server
修改my.cfg的配置文件
$ sudo vi /etc/mysql/my.cfg
修改内容如下:
bind-address? ? ? ? ? ? = 83
:wq
重新启动mysql服务
$ sudo service mysql restart
2.2. 创建Hive需要的数据库和用户
$ mysql -uroot -p
依次输入以下命令:
# 创建hive用户
insert into mysql.user(Host,User,Password) values(localhost,hive,password(hive));
# 创建数据库
create database hive;
# 授权
grant all on hive.* to hive@% identified by hive;
grant all on hive.* to hive@localhost identified by hive;
flush privileges;
# 退出
exit
Hive安装
3.1. 下载Hive
从官网(/downloads.html)上下载最新的稳定版本地址,并上传到服务器上。
本安装示例采用的版本为apache-hive-1.2.1-bin.tar.gz。
3.2. 解压并配置环境变量
解压安装文件到/opt目录
$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt
修改环境变量
$ sudo vi /etc/profile
修改如下内容
export HIVE_HOME=/opt/hive-1.2.1
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/bin:$PATH
:wq
启用配置
$ source /etc/pr
您可能关注的文档
- ORACLE 目录结构讲解.ppt
- arcgis,arcsde,oracle安装配置手册.doc
- UML建模技术4系统概要设计中的UML静态建模.ppt
- 4网络卫士防火墙NGFW 4000系列.doc
- SISO策划案(1讲课2.ppt
- 赛门铁克_终端管理套件_Endpoint_Mgmnt_Suite.ppt
- JUNIPER防火墙 初始配置及管理 Y810.ppt
- sql编程语言.ppt
- Juniper EX系列初级培训.ppt
- 2.3.1-2《数学归纳法》课件.ppt
- 上海市宝山区2025-2026学年第一学期期末考试高三英语试卷(含答案).pdf
- 云南省普洱市镇沅县第一中学2025-2026学年高二上学期期中考试语文试题(含答案).pdf
- 天津市扶轮中学2025-2026学年高一上学期第一次月考英语试题(含答案).pdf
- 上海市杨浦区2026届高三一模英语试题(含答案).pdf
- 湖北省八校联考2025-2026学年高二上学期月考语文试题(含答案).pdf
- 山西省介休市第一中学校2025-2026学年高二上学期期中考试英语试卷(含答案,无听力原文及音频).pdf
- 江苏省无锡市梅村高级中学2025-2026学年高二上学期期中英语试题(含答案).pdf
- 山东省临沂市临沭县2025-2026学年九年级(上)期中化学试卷(含答案).pdf
- 山东省菏泽市2025-2026学年高二上学期期中考试英语(B)试卷(含答案,无听力原文及音频).pdf
- IPO审核耗时与首发股票市场表现.pdf
最近下载
- 精品课件-《菩萨蛮·书江西造口壁》(优质课课件用).ppt VIP
- 应用高等数学(第2版)练习册胡桐春课后习题答案解析.docx VIP
- 2025年连云港专业技术人员公共课程公需考试-学习贯彻党的二十届三中全会精神.docx VIP
- 标准作业流程心得体会范文.docx VIP
- DBJT 61-38-2016 建筑给水排水与采暖工程施工工艺标准.docx VIP
- 尿液干化学法检测尿液红细胞与白细胞假阴性结果分析.doc VIP
- 皖南医学院《马克思主义基本原理》2016-2017学年期末考试卷.pdf VIP
- 2023年四川省气象部门事业单位招聘考试真题.docx VIP
- 简约手绘工作概述商务汇报通用PPT模板.pdf VIP
- 2023年四川省气象部门事业单位招聘考试真题.docx VIP
原创力文档


文档评论(0)