重剑无锋 Hive架构剖析.docxVIP

下载本文档

1
0
约1.77千字
约 5页
2021-11-14 发布于湖南
举报

重剑无锋 Hive架构剖析.docx

重剑无锋 | Hive架构剖析 hive的基本架构图如下图所示：相关组件引见数据存储 Hive中的数据可以存储在任意与Hadoop兼容的文件系统，其最常见的存储文件格式次要有ORC和Parquet。除了HDFS之外，也支持一些商用的云对象存储，比如AWS S3等。另外，Hive可以读入并写入数据到其他的独立处理系统，比如Druid、HBase等。 Data catalog Hive使用Hive Metastore(HMS)存储元数据信息，使用关系型数据库来长久化存储这些信息，其依靠于DataNucleus(供应了标准的接口（JDO, JPA）来访问各品种型的数据库资源 ),用于简化操作各种关系型数据库。为了恳求低延迟，HMS会直接通过DataNucleus直接查询关系型数据库。HMS的API支持多种编程言语。执行引擎最后版本的Hive支持MapReduce作为执行引擎，后来又支持 Tez和Spark作为执行引擎，这些执行引擎都可以运转在YARN上。查询服务 Hiveserver2(HS2)允许用户执行SQL查询，Hiveserver2允很多个客户端提交恳求到Hive并前往执行结果，HS2支持本地和近程JDBC和ODBC连接，另外Hive的发布版中包括一个JDBC的客户端，称之为Beeline。 Hive客户端 Hive支持多种客户端，比如Python, Java, C++

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

重剑无锋 Hive架构剖析.docxVIP