2026年国开电大大数据技术形考题库100道含完整答案(夺冠系列).docxVIP

  • 1
  • 0
  • 约2.49万字
  • 约 39页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术形考题库100道含完整答案(夺冠系列).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪项属于数据挖掘的典型应用场景?

A.对原始数据进行去重清洗

B.通过聚类算法实现客户细分

C.从传感器实时采集数据

D.将数据转换为图表进行展示

【答案】:B

解析:本题考察数据挖掘的定义及应用。数据挖掘是从大量数据中通过算法发现潜在模式或知识的过程。B选项“通过聚类算法实现客户细分”属于数据挖掘(聚类分析)的典型应用,通过对客户特征数据分组,识别不同客户群体。A选项“数据清洗”属于数据预处理环节,C选项“数据采集”是数据获取阶段,D选项“数据可视化”是数据呈现手段,均不属于数据挖掘。因此正确答案为B。

2、以下哪种算法属于无监督学习的聚类算法?

A.K-Means(无监督聚类)

B.SVM(监督分类算法)

C.决策树(监督分类/回归)

D.逻辑回归(监督分类/回归)

【答案】:A

解析:本题考察无监督学习算法类型。无监督学习无需标签,通过数据自身特征分组。K-Means是典型无监督聚类算法,将相似数据点自动划分为K个簇;SVM、决策树、逻辑回归均为监督学习算法,需预先标记的训练数据(如分类标签)。因此正确答案为A。

3、在机器学习中,用于预测类别标签(如“垃圾邮件/非垃圾邮件”)的算法是?

A.逻辑回归(LogisticRegression)

B.线性回归(LinearRegression)

C.K-means聚类算法

D.PCA(主成分分析)降维算法

【答案】:A

解析:本题考察机器学习算法类型知识点。逻辑回归是典型的分类算法,用于预测离散类别;线性回归是回归算法(预测连续值);K-means是无监督聚类算法(无标签数据分组);PCA是无监督降维算法(减少特征维度),均不用于分类任务。

4、在数据挖掘算法中,以下哪一项属于无监督学习算法?

A.K-Means聚类算法

B.支持向量机(SVM)

C.决策树

D.逻辑回归

【答案】:A

解析:本题考察数据挖掘算法分类知识点。无监督学习算法无需人工标注的标签数据,主要用于发现数据中的潜在模式或结构,A选项K-Means是典型的无监督聚类算法,通过距离度量将数据分组;B选项SVM(支持向量机)、C选项决策树、D选项逻辑回归均属于有监督学习算法,需要已知的训练标签数据,通过学习输入与输出的映射关系进行分类或回归预测。因此正确答案为A。

5、以下哪种算法属于数据挖掘中的聚类算法?

A.线性回归

B.K-Means

C.决策树

D.Apriori

【答案】:B

解析:K-Means是典型的聚类算法,通过最小化簇内距离将数据自动分组为不同簇;线性回归是预测连续值的回归算法,决策树是分类算法,Apriori是关联规则挖掘算法(用于发现数据项间关联关系,如“啤酒与尿布”),故正确答案为B。

6、以下哪种算法属于大数据分析中的监督学习?

A.K-Means

B.线性回归

C.PCA

D.Apriori

【答案】:B

解析:本题考察大数据分析中的监督学习知识点。监督学习需要有标签的训练数据,线性回归通过已知特征与标签的映射关系进行预测,属于监督学习;K-Means是无监督聚类算法,PCA是无监督降维算法,Apriori是无监督关联规则挖掘算法。因此正确答案为B。

7、Hadoop分布式文件系统(HDFS)的英文缩写是?

A.HDFS

B.HBase

C.MapReduce

D.YARN

【答案】:A

解析:本题考察Hadoop生态系统的核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统的缩写,用于存储海量数据;HBase是基于Hadoop的NoSQL数据库,MapReduce是分布式计算框架,YARN是Hadoop的资源管理器,均不属于分布式文件系统。因此正确答案为A。

8、大数据的5V特征中,不包括以下哪个?

A.Volume(容量)

B.Velocity(速度)

C.Valueability(价值能力)

D.Variety(多样性)

【答案】:C

解析:本题考察大数据5V特征知识点。大数据5V特征标准定义为Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)、Veracity(真实性)。选项C“Valueability”为干扰项,不存在该特征;A、B、D均为5V特征的正确组成部分。

9、大数据的‘5V’核心特征中,不包含以下哪一项?

A.Volume(规模)

B.Validity(有效性)

C.Velocity(速度)

D.Variety(多样性)

【答案】:B

解析:本题考察大数据的核心特征。大数据的‘5V’特

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档