2026年国开电大大数据技术形考题库100道附参考答案(预热题).docxVIP

  • 1
  • 0
  • 约2.52万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附参考答案(预热题).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、在大数据技术应用中,用于实时流数据处理的开源框架是?

A.SparkStreaming

B.Hadoop

C.Hive

D.HBase

【答案】:A

解析:本题考察大数据实时处理框架知识点。SparkStreaming是Spark生态系统中处理实时流数据的组件,支持高吞吐量和低延迟;Hadoop是批处理框架,侧重离线数据处理;Hive是基于Hadoop的数据仓库工具,用于SQL式查询;HBase是分布式NoSQL数据库,侧重存储而非实时流处理。因此正确答案为A。

2、以下哪项属于大数据在推荐系统中的典型应用场景?

A.电商平台的商品推荐(如淘宝首页个性化商品)

B.搜索引擎的结果排序(如百度根据用户偏好排序)

C.社交媒体的个性化内容推送(如抖音/微博的信息流推荐)

D.以上都是

【答案】:D

解析:本题考察大数据推荐系统的应用场景。大数据技术在推荐系统中应用广泛:电商平台通过用户历史行为数据推荐商品(A);搜索引擎根据用户搜索习惯和偏好优化结果排序(B);社交媒体通过分析用户兴趣标签推送个性化内容(C)。因此三个选项均属于典型应用场景,正确答案为D。

3、在大数据预处理流程中,以下哪项操作属于数据清洗?

A.处理数据中的缺失值

B.合并多个数据源的数据

C.将数据转换为

文档评论(0)

1亿VIP精品文档

相关文档