2026年大学数据科学与大数据技术(大数据分析技术)试题及答案.docxVIP

  • 0
  • 0
  • 约7.68千字
  • 约 17页
  • 2026-04-01 发布于四川
  • 举报

2026年大学数据科学与大数据技术(大数据分析技术)试题及答案.docx

2026年大学数据科学与大数据技术(大数据分析技术)试题及答案

一、单项选择题(共10题,每题2分,共20分)

1.以下哪种数据清洗操作用于处理“同一实体的不同字段值不一致”问题?

A.去重

B.标准化

C.填充缺失值

D.纠正矛盾值

答案:D

2.计算数据集{2,5,7,9,12}的中位数和方差(保留2位小数),正确结果是?

A.中位数7,方差11.36

B.中位数7,方差14.56

C.中位数9,方差11.36

D.中位数9,方差14.56

答案:B(中位数为排序后中间值7;均值为(2+5+7+9+12)/5=7.4,方差=((27.4)2+(57.4)2+(77.4)2+(97.4)2+(127.4)2)/5≈14.56)

3.以下不属于SparkRDD转换操作的是?

A.map()

B.reduce()

C.filter()

D.groupByKey()

答案:B(reduce()是行动操作)

4.在Kmeans算法中,若初始质心选择不当,最可能导致的问题是?

A.计算复杂度激增

B.陷入局部最优解

C.聚类结果不满足凸性

D.无法处理高维数据

答案:B

5.以下哪种数据可视化图表最适合展示“某城各季度

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档