- 2
- 0
- 约1.26万字
- 约 27页
- 2026-05-22 发布于四川
- 举报
2026年大数据技术应用(数据分析工具)试题及答案
1.单项选择题(每题2分,共20分)
1.1在SparkSQL中,下列哪一段代码可以正确注册一个临时视图并执行SQL查询?
A.df.registerTempTable(t);spark.sql(SELECT*FROMt)
B.df.createOrReplaceTempView(t);spark.sql(SELECT*FROMt)
C.df.cache();spark.sql(SELECT*FROMt)
D.spark.catalog.createTable(t,df);spark.sql(SELECT*FROMt)
答案:B
1.2使用Python的pandas处理缺失值时,若要求仅当一行中缺失值比例超过30%才丢弃该行,正确写法是:
A.df.dropna(thresh=len(df.columns)*0.7)
B.df.dropna(thresh=int(len(df.columns)*0.7))
C.df.dropna(thresh=len(df.columns)*0.3)
D.df.dropna(axis=1,thresh=0.7)
答案:B
1.3在HadoopYARN容量调度器中,关于队列最大资源容量的描述正确的是:
A.队列最大容量必须小于集群总资
原创力文档

文档评论(0)