- 0
- 0
- 约7.01千字
- 约 9页
- 2026-01-19 发布于山西
- 举报
2025年大数据技术《Hive查询》专项训练
考试时间:______分钟总分:______分姓名:______
一、选择题(每题2分,共20分)
1.下列哪个不是HiveQL中常用的数据过滤子句?
A.WHERE
B.HAVING
C.FILTER
D.IF
2.在Hive中,使用`SELECT*FROMtable_name;`语句查询数据时,如果表中存在NULL值,那么查询结果中该列的值会是?
A.0
B.NULL
C.空字符串
D.表中该列的第一个非NULL值
3.以下哪个聚合函数用于计算集合中元素的数量,无论元素值是否重复?
A.SUM
B.AVG
C.COUNT(DISTINCT)
D.MAX
4.在HiveQL中,要对查询结果按照某个列的值进行降序排序,应该使用哪个子句?
A.ORDERBY...ASC
B.ORDERBY...DESC
C.SORTBY...ASC
D.SORTBY...DESC
5.以下哪个JOIN操作会返回两个表中所有可能的组合,即使右表在左表中没有匹配项?
A.INNERJOIN
B.LEFTOUTERJOIN
C.RIGHTOUTERJOIN
D.FULLOUTERJOIN
6.当使用`GROUPBY`子句对数据进行分组时,SELECT语句中哪些列可以不需要出现在GROUPBY子句中?
A.所有非聚合列
B.所有聚合列
C.仅聚合列
D.仅计算列
7.在Hive中,`CAST(2023-10-27ASTIMESTAMP)`这句话的作用是?
A.将字符串2023-10-27转换为整数类型
B.将字符串2023-10-27转换为日期类型
C.将字符串2023-10-27转换为时间戳类型
D.抛出异常,因为字符串格式不正确
8.以下哪个Hive内置函数用于计算字符串的长度?
A.LENGTH
B.SIZE
C.LENGTHSTR
D.COUNT
9.在Hive中,`CREATETABLEtable2CLUSTEREDBY(col1)INTO4BUCKETS;`语句的作用是?
A.创建一个包含4个桶的外部表table2
B.将table2表中的数据按照col1列的值进行散列,分为4个桶
C.将table2表中的数据按照行数平均分配到4个文件中
D.为table2表添加一个名为col1的分区列
10.以下哪个窗口函数可以用来为每个分组内的行生成一个唯一的序号,序号从1开始?
A.RANK()
B.DENSE_RANK()
C.ROW_NUMBER()
D.NTILE()
二、填空题(每空2分,共20分)
1.在HiveQL中,使用`LIKE`关键字进行模糊查询时,通配符`_`代表______个任意字符,通配符`%`代表______个任意字符。
2.语句`SELECTcol1,col2FROMtable1WHEREcol1ISNOTNULLANDcol2=value;`中,`col1ISNOTNULL`用于过滤掉col1列中______的行。
3.若要使用`ORDERBY`子句对查询结果进行排序,则在一个SELECT语句中最多可以指定______个排序条件。
4.在Hive中,使用`INNERJOINtable2ONtable1.col_a=table2.col_b`语句时,如果table1中的某行在table2中没有匹配的行,那么这条记录在JOIN结果中______。
5.语句`SELECTCOUNT(*)FROMtable_nameGROUPBYcol1;`会为col1的每个不同值返回______条记录的计数。
6.要将字符串常量`100`转换为整数类型,可以使用函数______或______。
7.如果要查询`date_table`表中2023年所有月份的订单总数,可以使用聚合函数______和GROUPBY子句。
8.HiveQL中`SELECTcol1FROMtable1WHEREcol2IN(val1,val2,val3);`子句的作用是选择col2列的值等于___
原创力文档

文档评论(0)