2025年大数据技术《Hive查询》专项训练.docxVIP

  • 0
  • 0
  • 约7.01千字
  • 约 9页
  • 2026-01-19 发布于山西
  • 举报

2025年大数据技术《Hive查询》专项训练.docx

2025年大数据技术《Hive查询》专项训练

考试时间:______分钟总分:______分姓名:______

一、选择题(每题2分,共20分)

1.下列哪个不是HiveQL中常用的数据过滤子句?

A.WHERE

B.HAVING

C.FILTER

D.IF

2.在Hive中,使用`SELECT*FROMtable_name;`语句查询数据时,如果表中存在NULL值,那么查询结果中该列的值会是?

A.0

B.NULL

C.空字符串

D.表中该列的第一个非NULL值

3.以下哪个聚合函数用于计算集合中元素的数量,无论元素值是否重复?

A.SUM

B.AVG

C.COUNT(DISTINCT)

D.MAX

4.在HiveQL中,要对查询结果按照某个列的值进行降序排序,应该使用哪个子句?

A.ORDERBY...ASC

B.ORDERBY...DESC

C.SORTBY...ASC

D.SORTBY...DESC

5.以下哪个JOIN操作会返回两个表中所有可能的组合,即使右表在左表中没有匹配项?

A.INNERJOIN

B.LEFTOUTERJOIN

C.RIGHTOUTERJOIN

D.FULLOUTERJOIN

6.当使用`GROUPBY`子句对数据进行分组时,SELECT语句中哪些列可以不需要出现在GROUPBY子句中?

A.所有非聚合列

B.所有聚合列

C.仅聚合列

D.仅计算列

7.在Hive中,`CAST(2023-10-27ASTIMESTAMP)`这句话的作用是?

A.将字符串2023-10-27转换为整数类型

B.将字符串2023-10-27转换为日期类型

C.将字符串2023-10-27转换为时间戳类型

D.抛出异常,因为字符串格式不正确

8.以下哪个Hive内置函数用于计算字符串的长度?

A.LENGTH

B.SIZE

C.LENGTHSTR

D.COUNT

9.在Hive中,`CREATETABLEtable2CLUSTEREDBY(col1)INTO4BUCKETS;`语句的作用是?

A.创建一个包含4个桶的外部表table2

B.将table2表中的数据按照col1列的值进行散列,分为4个桶

C.将table2表中的数据按照行数平均分配到4个文件中

D.为table2表添加一个名为col1的分区列

10.以下哪个窗口函数可以用来为每个分组内的行生成一个唯一的序号,序号从1开始?

A.RANK()

B.DENSE_RANK()

C.ROW_NUMBER()

D.NTILE()

二、填空题(每空2分,共20分)

1.在HiveQL中,使用`LIKE`关键字进行模糊查询时,通配符`_`代表______个任意字符,通配符`%`代表______个任意字符。

2.语句`SELECTcol1,col2FROMtable1WHEREcol1ISNOTNULLANDcol2=value;`中,`col1ISNOTNULL`用于过滤掉col1列中______的行。

3.若要使用`ORDERBY`子句对查询结果进行排序,则在一个SELECT语句中最多可以指定______个排序条件。

4.在Hive中,使用`INNERJOINtable2ONtable1.col_a=table2.col_b`语句时,如果table1中的某行在table2中没有匹配的行,那么这条记录在JOIN结果中______。

5.语句`SELECTCOUNT(*)FROMtable_nameGROUPBYcol1;`会为col1的每个不同值返回______条记录的计数。

6.要将字符串常量`100`转换为整数类型,可以使用函数______或______。

7.如果要查询`date_table`表中2023年所有月份的订单总数,可以使用聚合函数______和GROUPBY子句。

8.HiveQL中`SELECTcol1FROMtable1WHEREcol2IN(val1,val2,val3);`子句的作用是选择col2列的值等于___

文档评论(0)

1亿VIP精品文档

相关文档