重庆交通大学《Hadoop技术与应用实训》2023-2024学年第一学期期末试卷.docVIP

  • 0
  • 0
  • 约5.84千字
  • 约 8页
  • 2026-03-31 发布于重庆
  • 举报

重庆交通大学《Hadoop技术与应用实训》2023-2024学年第一学期期末试卷.doc

装订线

装订线

PAGE2

第PAGE1页,共NUMPAGES3页

重庆交通大学

《Hadoop技术与应用实训》2023-2024学年第一学期期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

一、单选题(本大题共30个小题,每小题1分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、在进行数据分析时,选择合适的统计指标对于描述数据特征非常重要。假设要分析一组学生的考试成绩分布情况,包括成绩的集中趋势和离散程度。以下哪个统计指标组合最能全面地描述数据的分布特征?()

A.均值和标准差

B.中位数和方差

C.众数和极差

D.以上指标都不够全面

2、在数据挖掘中,Apriori算法常用于挖掘频繁项集。以下关于Apriori算法的描述,正确的是?()

A.它是一种无监督学习算法

B.它只能处理数值型数据

C.它的计算复杂度较低

D.它需要事先指定频繁项集的支持度阈值

3、在数据分析中,数据清洗是至关重要的一步。假设我们有一个包含大量客户信息的数据集,其中存在缺失值、错误数据和重复记录等问题。为了得到高质量、准确且可用的数据,以下哪种数据清洗方法通常是首先考虑的?()

A.直接删除包含缺失值或错

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档