2026年大数据技术应用(数据分析工具)试题及答案.docxVIP

  • 2
  • 0
  • 约1.26万字
  • 约 27页
  • 2026-05-22 发布于四川
  • 举报

2026年大数据技术应用(数据分析工具)试题及答案.docx

2026年大数据技术应用(数据分析工具)试题及答案

1.单项选择题(每题2分,共20分)

1.1在SparkSQL中,下列哪一段代码可以正确注册一个临时视图并执行SQL查询?

A.df.registerTempTable(t);spark.sql(SELECT*FROMt)

B.df.createOrReplaceTempView(t);spark.sql(SELECT*FROMt)

C.df.cache();spark.sql(SELECT*FROMt)

D.spark.catalog.createTable(t,df);spark.sql(SELECT*FROMt)

答案:B

1.2使用Python的pandas处理缺失值时,若要求仅当一行中缺失值比例超过30%才丢弃该行,正确写法是:

A.df.dropna(thresh=len(df.columns)*0.7)

B.df.dropna(thresh=int(len(df.columns)*0.7))

C.df.dropna(thresh=len(df.columns)*0.3)

D.df.dropna(axis=1,thresh=0.7)

答案:B

1.3在HadoopYARN容量调度器中,关于队列最大资源容量的描述正确的是:

A.队列最大容量必须小于集群总资

文档评论(0)

1亿VIP精品文档

相关文档