2025年大数据技术专业技能考试试卷及答案.docxVIP

2025年大数据技术专业技能考试试卷及答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年大数据技术专业技能考试及答案

1.单项选择题(每题2分,共30分)

1.1在Hadoop3.x中,下列哪项参数可用来动态调整DataNode的磁盘卷容错阈值?

A.dfs.datanode.failed.volumes.tolerated

B.dfs.datanode.disk.check.timeout

C.dfs.block.size

D.dfs.namenode.stale.datanode.interval

答案:A

解析:failed.volumes.tolerated决定DataNode在多少块磁盘失效后仍可提供服务,支持在线刷新。

1.2使用Flink1.17进行Exactly-Once处理时,若Source为Kafka,Sink为MySQL,必须同时开启哪两项机制?

A.Kafka事务+MySQLXA

B.FlinkCheckpoint+Kafka两阶段提交

C.FlinkCheckpoint+MySQL幂等写入

D.FlinkSavepoint+Kafka事务

答案:C

解析:Checkpoint保障Flink内部一致性,幂等写入保障下游重放时不重复。

1.3某电商公司使用DeltaLake2.4,欲在MERGE语句中仅更新近7天分区,最佳写法是:

A.MERGE…WHENMATCHEDANDdatecurrent_date()-7THENUPDATE

B.MERGE…WHENMATCHEDTHENUPDATEWHEREdatecurrent_date()-7

C.在USING子句中加WHEREdatecurrent_date()-7

D.先DELETE分区再INSERT

答案:C

解析:DeltaLake支持在USING子句中预过滤,减少shuffle,且符合ACID。

1.4ClickHouse23.5执行SELECT时,发现index_granularity=8192,但where条件为float列,未走索引,最可能原因:

A.该列未建minmax索引

B.该列为Nullable

C.该列使用了LowCardinality

D.该列精度超过64位

答案:A

解析:ClickHouse默认对float不建minmax索引,需手动ADDINDEX。

1.5Pulsar2.11的topiccompaction触发条件由哪项参数决定?

A.compactionMaxNumBuckets

B.compactionThresholdInBytes

C.maxConsumersPerSubscription

D.messageTTLInSeconds

答案:B

解析:当topic积压超过阈值才触发compaction,避免频繁IO。

1.6在Spark3.4中,使用AES-NI加速AES解密,需开启:

A.spark.io.encryption.enabled

B.spark.security.crypto.enabled

C.spark.hadoop.fs.s3a.server-side-encryption-algorithm

D.spark.ssl.enabled

答案:B

解析:spark.security.crypto.enabled控制JVM层AESintrinsics开关。

1.7某企业使用Snowflake,欲对半结构化数据启用SchemaEvolution,应使用:

A.VARIANT+COPYINTOWITHON_ERROR=CONTINUE

B.PARQUET+AUTO_INGEST

C.CSV+SKIP_HEADER=1

D.XML+STRIP_OUTER_ELEMENT=TRUE

答案:A

解析:VARIANT类型支持自动演化,COPY可容错。

1.8当Trino414连接Hive3.1时,欲读取ORC的BloomFilter,需设置:

A.hive.orc.bloom-filters.enabled=true

B.hive.bloom-filter.enabled=true

C.orc.bloom.filter.enabled=true

D.hive.orc.bloom.filters.read=true

答案:A

解析:Trino通过hive.orc.bloom-filters.enabled控制下推。

1.9使用Hudi0.14的F

您可能关注的文档

文档评论(0)

151****3398 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档