大数据高并发面试题及详细答案.docxVIP

  • 2
  • 0
  • 约1.02万字
  • 约 11页
  • 2026-05-25 发布于河北
  • 举报

大数据高并发面试题及详细答案

一、基础必考题(入门级,必问)

1.什么是大数据高并发?实际业务中你怎么判断系统达到了高并发瓶颈?

答案:大数据高并发,核心是“数据量大”+“请求量大”,指系统在单位时间内(比如1秒)需要处理海量的数据输入/输出,同时响应大量用户请求,且要保证响应延迟在合理范围(比如毫秒级)、系统不崩溃。

实际判断瓶颈,不会只看QPS,会结合3个核心指标+业务现象:

1.核心指标:QPS(每秒请求数),比如普通接口QPS超过1万、核心接口(如支付、下单)超过5000,就需要警惕;响应延迟(RT),接口RT从正常的100ms飙升到500ms以上,且持续不回落;服务器负载(CPU、内存、磁盘IO),CPU长期占用80%以上,内存使用率超过90%,磁盘IO读写频繁(比如HDFS读写峰值过高)。

2.业务现象:用户反馈接口卡顿、超时;系统出现大量报错(比如连接超时、数据库连接池耗尽);日志中频繁出现“线程阻塞”“队列满”等关键词;数据处理出现积压(比如Kafka消息堆积、Spark任务延迟)。

补充:不是QPS高就一定是瓶颈,比如静态资源接口QPS即使到10万,只要RT稳定、服务器负载正常,就不算瓶颈;但核心业务接口,哪怕QPS只有3000,若RT飙升、数据处理积压,就是瓶颈。

2.大数据高并发场景中,最常见的性能瓶颈有哪些?分别对应什么问题?

答案:实际工作中

文档评论(0)

1亿VIP精品文档

相关文档