大数据数学考试模拟题及答案分享平台论坛.docVIP

  • 0
  • 0
  • 约2.21千字
  • 约 6页
  • 2026-07-02 发布于河北
  • 举报

大数据数学考试模拟题及答案分享平台论坛.doc

大数据数学考试模拟题及答案分享平台论坛

一、选择题(每题5分,共30分)

1.以下哪个是大数据中常用的数据分析方法?

A.因式分解

B.回归分析

C.勾股定理计算

D.三角形面积计算

2.大数据处理中,数据清洗的主要目的不包括以下哪项?

A.去除重复数据

B.填补缺失值

C.计算数据的标准差

D.纠正错误数据

3.某数据集有100个数据点,其均值为50,中位数为48,众数为45,若再加入一个数据点45,那么新数据集的众数会()

A.不变

B.变大

C.变小

D.无法确定

4.大数据可视化中,哪种图表适合展示数据的分布情况?

A.柱状图

B.折线图

C.饼图

D.箱线图

5.对于线性回归模型y=2x+3,当x=5时,预测的y值是()

A.10

B.13

C.15

D.18

6.在大数据聚类算法中,以下哪种距离度量方式常用于计算样本间的相似度?

A.两点间直线距离

B.曼哈顿距离

C.角度距离

D.面积距离

二、填空题(每题5分,共20分)

1.大数据分析的流程一般包括数据采集、数据预处理、______、数据分析和数据可视化。

2.已知一组数据的方差为9,那么其标准差为______。

3.在分类算法中,决策树是一种基于______的方法。

4.数据挖掘中的关联规则挖掘主要是发现数据中不同属性之间

文档评论(0)

1亿VIP精品文档

相关文档