上饶师范学院《大数据机器学习》2023-2024学年第二学期期末试卷.docVIP

  • 1
  • 0
  • 约3.71千字
  • 约 6页
  • 2026-06-09 发布于重庆
  • 举报

上饶师范学院《大数据机器学习》2023-2024学年第二学期期末试卷.doc

自觉遵守考场纪律如考试作弊此答卷无效密

自觉遵守考场纪律如考试作弊此答卷无效

线

第PAGE1页,共NUMPAGES3页

上饶师范学院《大数据机器学习》

2023-2024学年第二学期期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

批阅人

一、单选题(本大题共20个小题,每小题1分,共20分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、大数据的处理通常需要分布式计算框架来提高效率。假设有一个需要对海量文本数据进行词频统计的任务,数据量达到数百TB。以下哪种分布式计算框架最适合处理这种大规模的数据处理任务?()

A.HadoopMapReduce

B.Spark

C.Flink

D.Storm

2、大数据中的图计算在社交网络分析、物流路径规划等领域有广泛应用。以下关于图计算模型和算法的描述,哪一个是不准确的?()

A.常见的图计算模型包括有向图、无向图和加权图等

B.广度优先搜索和深度优先搜索是图遍历的基本算法

C.最短路径算法如Dijkstra算法和A*算法常用于求解图中的最优路径问题

D.图计算算法的效率与图的规模无关,只取决于算法的复杂度

3、假设要对大量的文本数据进行关键词提取和主题建模

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档