- 0
- 0
- 约2.21千字
- 约 6页
- 2026-07-02 发布于河北
- 举报
大数据数学考试模拟题及答案分享平台论坛
一、选择题(每题5分,共30分)
1.以下哪个是大数据中常用的数据分析方法?
A.因式分解
B.回归分析
C.勾股定理计算
D.三角形面积计算
2.大数据处理中,数据清洗的主要目的不包括以下哪项?
A.去除重复数据
B.填补缺失值
C.计算数据的标准差
D.纠正错误数据
3.某数据集有100个数据点,其均值为50,中位数为48,众数为45,若再加入一个数据点45,那么新数据集的众数会()
A.不变
B.变大
C.变小
D.无法确定
4.大数据可视化中,哪种图表适合展示数据的分布情况?
A.柱状图
B.折线图
C.饼图
D.箱线图
5.对于线性回归模型y=2x+3,当x=5时,预测的y值是()
A.10
B.13
C.15
D.18
6.在大数据聚类算法中,以下哪种距离度量方式常用于计算样本间的相似度?
A.两点间直线距离
B.曼哈顿距离
C.角度距离
D.面积距离
二、填空题(每题5分,共20分)
1.大数据分析的流程一般包括数据采集、数据预处理、______、数据分析和数据可视化。
2.已知一组数据的方差为9,那么其标准差为______。
3.在分类算法中,决策树是一种基于______的方法。
4.数据挖掘中的关联规则挖掘主要是发现数据中不同属性之间
原创力文档

文档评论(0)