- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop Hive sql语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言查询,汇总,分析数据。而mapreduce开发人员可以把己写的mapper 和reducer 作为插件来支持Hive 做更复杂的数据分析。它与关系型数据库的SQL 略有不同,但支持了绝大多数的语句如DDL、DML 以及常见的聚合函数、连接查询、条件查询。HIVE不适合用于联机online)事务处理,也不提供实时查询功能。它最适合应用在基于大量不可变数据的批处理作业。HIVE的特点:可伸缩(在Hadoop的集群上动态的添加设备),可扩展,容错,输入格式的松散耦合。Hive 的官方文档中对查询语言有了很详细的描述,请参考:/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。1. DDL 操作DDL?建表?删除表?修改表结构?创建/删除视图?创建数据库?显示命令建表:CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] [ROW FORMAT row_format] [STORED AS file_format] [LOCATION hdfs_path]?CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT EXIST 选项来忽略这个异常?EXTERNAL 关键字可以让用户创建一个外部表,在建表的同时指定一个指向实际数据的路径(LOCATION)?LIKE 允许用户复制现有的表结构,但是不复制数据?COMMENT可以为表与字段增加描述?ROW FORMATDELIMITED [FIELDS TERMINATED BY char] [COLLECTION ITEMS TERMINATED BY char][MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]| SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, ...)]用户在建表的时候可以自定义 SerDe 或者使用自带的 SerDe。如果没有指定 ROW FORMAT 或者 ROW FORMAT DELIMITED,将会使用自带的 SerDe。在建表的时候,用户还需要为表指定列,用户在指定表的列的同时也会指定自定义的 SerDe,Hive 通过 SerDe 确定表的具体的列的数据。?STORED ASSEQUENCEFILE| TEXTFILE| RCFILE | INPUTFORMAT input_format_classname OUTPUTFORMAT output_format_classname如果文件数据是纯文本,可以使用 STORED AS TEXTFILE。如果数据需要压缩,使用 STORED AS SEQUENCE 。创建简单表:hive CREATE TABLE pokes (foo INT, bar STRING); 创建外部表:CREATE EXTERNAL TABLE page_view(viewTime INT, userid BIGINT,page_url STRING, referrer_url STRING,ip STRING COMMENT IP Address of the User,country STRING COMMENT country of originati
您可能关注的文档
- GSM入门教材….doc
- H7800圆锥破碎机….doc
- HAD-YCBIII,YCCII说明书….doc
- Hamilton汉密尔顿焦虑量表….doc
- hao果蔬加工工艺学复习题….doc
- hart475手操器调试EJA变送器步骤….doc
- Harvoni(ledipasvir和sofosbuvir)使用说明书2014年第一版….doc
- HAYGROUP三种动机threesocialmotives….doc
- HB-3000布氏说明书….doc
- HCP200A中文操作维护手册[B]….doc
- 标准曲线与回收试验.pptx
- 景基于过程支架的读后续写.pptx
- 万向钱潮股份有限公司2024年招聘762人公开引进急需紧缺人才笔试参考题库(共100题)答案真题题库.docx
- 2024年荣成市橡胶厂招聘762人公开引进急需紧缺人才笔试参考题库(共100题)答案题库大全含答案【.docx
- 2024浙江杭萧钢构股份有限公司招聘3人高频100题难、易错点模拟试题附带答案大全附答案(考试直接用.docx
- 五矿资源有限公司完整版校园招聘62人【重点基础提升】模拟试题(共100题)附带答案完整题库A4版可打.docx
- 2024年陕西省延长县医疗保险管理办公室招考编外合同工高频难、易错点200题模拟试题题库(模拟题).docx
- 亿和精密金属制品(深圳)有限公司整理招聘193人高频考题难、易错点模拟试题(共100题)附带答案题库.docx
- 吉林省伊通满族自治县历年人民医院招聘历年高频难、易错点200题模拟试题真题附参考答案(研优卷).docx
- 先锋高科技上海有限公司2023-24年招聘80人历年高频考题难、易错点模拟试题(共100题)附带答案.docx
文档评论(0)