大数据运维工程师岗位招聘考试试卷及答案.docVIP

  • 118
  • 0
  • 约2.79千字
  • 约 7页
  • 2026-01-17 发布于山东
  • 举报

大数据运维工程师岗位招聘考试试卷及答案.doc

大数据运维工程师岗位招聘考试试卷及答案

一、填空题(每题1分,共10分)

1.HDFS默认的文件块大小是______MB。

2.YARN中负责资源管理调度的核心组件是______。

3.Spark的核心抽象数据结构是______。

4.ZooKeeper默认的选举算法是______。

5.Hive元数据默认存储在______数据库。

6.Kafka主题的分区数由创建时的______参数决定。

7.Flume的核心组件包括Source、Channel和______。

8.HBase行键设计需避免______热点。

9.Storm拓扑由Spout和______组成。

10.ELK中负责日志收集的组件是______。

二、单项选择题(每题2分,共20分)

1.以下不是HDFSNamenode高可用方案的是?

A.共享存储B.联邦HDFSC.主从复制D.本地存储

2.YARN中Container资源分配由哪个组件决定?

A.ResourceManagerB.NodeManagerC.ApplicationMasterD.ContainerManager

3.Spark哪种模式不依赖YARN?

A.localB.yarn-clientC.yarn-clusterD.mesos

4.Kafka消息默认保留时间是?

A.1小时B.7天C.30天D.永久

5.Hive默认执行引擎是?

A.MapReduceB.TezC.SparkD.Presto

6.ZooKeeper中临时有序节点是?

A.PERSISTENTB.EPHEMERALC.PERSISTENT_SEQUENTIALD.EPHEMERAL_SEQUENTIAL

7.Flume中监听文件变化的Source是?

A.ExecB.SpoolingDirectoryC.TaildirD.Avro

8.HBaseRegion分裂触发条件是?

A.行数阈值B.大小阈值C.时间阈值D.请求数阈值

9.Storm拓扑并行度由谁决定?

A.Spout并行度B.Bolt并行度C.Worker数量D.以上都是

10.ELK中存储检索日志的是?

A.ElasticsearchB.LogstashC.KibanaD.Beats

三、多项选择题(每题2分,共20分)

1.大数据运维监控工具包括?

A.PrometheusB.GrafanaC.NagiosD.Zabbix

2.HDFS进入安全模式的条件?

A.Namenode元数据检查B.磁盘使用率过高C.Datanode失联超阈值D.Namenode内存不足

3.YARN支持的调度器?

A.FIFOB.CapacityC.FairD.Priority

4.Spark缓存机制包括?

A.cache()B.persist()C.unpersist()D.broadcast()

5.Kafka消费者组特性?

A.一个消费者属一个组B.组内并行消费不同分区C.消费者数可超分区数D.组间互不影响

6.Hive优化手段?

A.分区B.分桶C.向量化查询D.引擎切换

7.ZooKeeper应用场景?

A.分布式锁B.服务发现C.配置中心D.集群选举

8.Flume拦截器类型?

A.TimestampB.HostC.Regex过滤D.Avro

9.HBase查询优化?

A.合理RowKeyB.避免全表扫描C.预分区D.过滤器

10.ELK日志流程组成?

A.收集(Beats/Logstash)B.解析(Logstash)C.存储(Elasticsearch)D.可视化(Kibana)

四、判断题(每题2分,共20分)

1.HDFS默认块大小64MB。()

2.YARNNodeManager管理单节点资源。()

3.SparkRDD是可变数据集。()

4.Kafka分区数越多性能越好。()

5.Hive元数据默认存Derby。()

6.ZooKeeper选举需半数以上节点投票。()

7.FlumeChannel支持异步写Sink。()

8.HBaseRegion是最小存储单元。()

9.StormSpout发送数据流到Bolt。()

10.Kibana负责日志收集解析。()

五、简答题(每题5分,共20分)

1.简述HDFSNamenode和Datanode的作用。

2.说明YARN核心组件及功能。

3.如何优化Kafka性能?

4.大数据运维常见监控指标有哪些?

六、讨论题(每题5分,共10分)

1.设计大数据集群故障应急处理流程。

2.如何平衡大数据集群性能与成本?

---

答案部分

一、填空题答案

1.128

2.ResourceManager

3.RDD

4.ZAB

5.Derby

6.partition

7.Sink

8.数据

9.Bolt

10.Beats

二、

文档评论(0)

1亿VIP精品文档

相关文档