- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第八章 分布式数据仓库技术Hive 8.1 Hive出现的原因 如何实现对 SQL 技术比较熟悉的程序设计人员在 Hadoop 平台上对海量数据进行分析? 如何实现传统的数据格式到 Hadoop 平台上的迁移,如基于传统关系型数据库的数据格式和 SQL 处理技术? 如何实现传统数据库设计人员在 Hadoop 平台上使用其所熟悉的 SQL技术施展才能? 如何在分布式环境下采用数据仓库技术从更多的数据中快速地获取数据的有效价值? 8.1.1 Hive的定义 Hive 是一种数据仓库技术,用于查询和管理存储在分布式环境下的大数据集, 由 Facebook 公司研发并作为开源项目贡献给了 Apache 软件基金会,目前 Hive 成功升级为 Apache 的顶级项目,并获得了全球大多数自由软件爱好者和大型软件公司的源码贡献和功能完善,成为一个应用广泛、可扩展的数据处理平台。 8.2 Hive 服务组成–体系结构 8.3 Hive安装 1.基本安装 2. MySQL安装 3. Hive 配置 hive-site.xml 文件内容 编辑 hive-env.sh 文件,在文件末尾添加变量指向 Hadoop 的安装路径 创建数据仓库操作过程中临时数据在 HDFS 上的转存目录 创建数据仓库操作过程中数据文件在 HDFS 上的存储目录 分别对刚创建的目录添加组可写权限,允许同组用户进行数据分析操作 8.3 Hive安装–相关的属性设置方法 1.Hive SET 命令 2.进入 Hive 会话带-hiveconf 选项 3.读 hive-site.xml 文件 4.读 hive-default.xml 文件 5.读 hadoop-site.xml 文件及其相关文件(如 core-site.xml、hdfs-site.xml、mapred-site.xml) 6.读 hadoop-default.xml 文件及其相关文件(如 core-default.xml、hdfs-default.xml、mapred-default.xml) 8.4 Hive Shell 介绍 Hive Shell 运行在 Hadoop 集群环境上,是 Hive 提供的命令行接口(CLI) ,在 Hive 提示符输入 HiveQL 命令, Hive Shell 把 HiveQL 查询转换为一系列 MapReduce 作业对任务进行并行处理, 然后返回处理结果。 Hive 采用 RDBMS 表 (table) 形式组织数据, 并为存储在 Hadoop上的数据提供附属的对数据进行展示的结构描述信息,该描述信息称为元数据(metadata)或表模式,以 metastore 形式存储在 RDBMS 数据库中。Hive Shell 下的大多数操作与 MySQL 命令一致,熟悉 MySQL 的使用者会察觉两者的语法操作基本一样。 8.5 HiveQL 详解– HiveQL与SQL的差异 8.5.1 Hive 管理数据方式 1.内部表 2. 外部表 3.内部表与外部表之间的抉择 4.分区 5.桶 8.5.2 Hive 表 DDL 操作 1. Create/Drop/Alter 数据库 2. Create/Drop/Truncate 表 3. Alter 表/分区/列 4. Create/Drop/Alter 视图 5. Create/Drop/Alter 索引 6. Create/Drop 函数 7. Create/Drop/Grant/Revoke 角色和权限 8.5.3 Hive 表 DML 操作 1.将文件中的数据导入(Load)到 Hive 表中 2. Select 操作 3.将 select 查询结果插入 hive 表中 4.将 select 查询结果写入文件 5. Hive 表 ACID 事务特性 NOW Handout Page * * Page *
您可能关注的文档
- Flash动画制作精品教程 (5).ppt
- Flash动画制作精品教程 (6).ppt
- Flash动画制作精品教程 (7).ppt
- Flash动画制作精品教程 (8).ppt
- Flash动画制作精品教程 (9).ppt
- Flash动画制作精品教程 (10).ppt
- Flash动画制作精品教程 (11).ppt
- Flash动画制作精品教程 (12).ppt
- Flash动画制作精品教程 (13).ppt
- Flash动画制作精品教程 (14).ppt
- Hadoop大数据处理技术基础与实践第二章 Hadoop 安装与配置管理.ppt
- Hadoop大数据处理技术基础与实践第九章 分布式数据分析工具Pig.ppt
- Hadoop大数据处理技术基础与实践第六章 HBase.ppt
- Hadoop大数据处理技术基础与实践第七章 ZooKeeper 技术.ppt
- Hadoop大数据处理技术基础与实践第三章 HDFS 技术.ppt
- Hadoop大数据处理技术基础与实践第十一章 Hadoop1.x与Hadoop2.x的比较.ppt
- Hadoop大数据处理技术基础与实践第十章 Sqoop.pptx
- Hadoop大数据处理技术基础与实践第四章 MapReduce.ppt
- Hadoop大数据处理技术基础与实践第五章 Hadoop I_O 操作.ppt
- Hadoop大数据处理技术基础与实践第一章 Hadoop 概述.ppt
最近下载
- 【期货市场技术分析】完整版——约翰.墨菲.doc VIP
- 秋季养生ppt课件.pptx
- 2023年北京电影学院导演专业真题.docx
- 课程设计-基于systemview的2ask信号调制与解调 .pdf VIP
- 2023年北京电影学院部分专业历届校考真题汇编.pdf VIP
- 絮凝剂对MBR活性污泥理化性质的影响研究.pdf VIP
- 2026年高考作文素材积累之九三阅兵:这一刻,与祖国同频共振.docx VIP
- 2025年辽宁省初中学业水平考试英语模拟试卷试题(含答案).pdf VIP
- 2025年辽宁省大连市中考英语模拟试卷.docx VIP
- 2025年中考英语冲刺模拟试卷-辽宁地区-学生版.pdf VIP
文档评论(0)