大数据挖掘导论与案例 习题答案 第8章 大数据挖掘关键技术.docx

大数据挖掘导论与案例 习题答案 第8章 大数据挖掘关键技术.docx

大数据挖掘导论与案例习题参考答案

第8章大数据挖掘关键技术

习题1:

Hadoop集群有3种运行模式,分别是本体模式、伪分布式模式和完全分布式模式。本地模式是极简环境,用于代码调试。伪分布式模式采用单节点模拟分布式,用于学习和功能验证。完全分布式模式则是多节点真实集群,用于生产环境处理大规模数据。

习题2:

Hadoop的核心优势在于高容错、高扩展、低成本处理大规模离线数据,适合日志分析、数据仓库等场景,但其实时性差、资源利用率低等局限性,使其在实时计算、迭代计算等场景中逐渐被Spark、Flink等框架补充或替代。实际应用中,常需结合具体业务需求(如数据量、实时性要求)选择或搭配使用。

文档评论(0)

1亿VIP精品文档

相关文档