大数据技术与应用问题汇总及解答.pdfVIP

  • 1
  • 0
  • 约1.33千字
  • 约 1页
  • 2026-05-22 发布于北京
  • 举报

1.用户你做吗?

2.写SQL,数据量就是大,需要很高的性能,性能最优化有几种方式?

3.元数据管理怎么做的?

4.怎么处理离线数仓表与表的依赖关系,如果有一个字段发生错误,怎么短时间内找到其

影响范围?

5.堆排序底层

6.java回收版本

7.Java线程池参数

8.项目中造成OOM的常见,OOM常见的解决方法,

9.HBase的热点问题

10.拉链表的应用场景、字段、和那些是拉链表特有的

11.用flink统计过哪些指标

12.用spark统计过哪些指标

13.项目中在哪些地方用到过压缩

14.Flink两阶段提交如果checkpoint成功,但commit失败了那么这个成功的checkpoint

会被删除吗?也就是,成功的Checkpoint会回滚到上一次的Checkpoint吗?

15.刚才听了一下你的项目,flume这用了,你是怎么实现的?

16.flume这的你这为什么要用到?

17.flume的代码是你写的对吧,你说一下具体怎么写的,干了什么?

18.hive分层这儿你用了四层,有一层是

文档评论(0)

1亿VIP精品文档

相关文档