2026年国开电大大数据技术形考题库100道含答案(夺分金卷).docxVIP

  • 0
  • 0
  • 约2.54万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道含答案(夺分金卷).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据在医疗领域的典型应用场景是?

A.智能交通信号控制(交通领域)

B.医疗影像辅助诊断(医疗领域)

C.电商个性化推荐(电商领域)

D.社交网络舆情监控(舆情领域)

【答案】:B

解析:本题考察大数据应用场景知识点。医疗影像辅助诊断利用大数据分析医学影像数据,辅助医生提高诊断效率;A属于交通领域的智能信号控制,C属于电商的个性化推荐,D属于舆情监控领域,均非医疗典型应用。因此选B。

2、以下哪项不属于数据预处理的步骤?

A.数据清洗

B.数据集成

C.数据挖掘

D.数据规约

【答案】:C

解析:本题考察大数据分析流程中数据预处理的知识点。数据预处理的核心步骤包括数据清洗(处理缺失值、异常值)、数据集成(合并多源数据)、数据转换(格式转换、归一化)、数据规约(降维、特征选择)。数据挖掘属于数据分析阶段的技术,通过算法从数据中提取有价值信息,不属于预处理步骤。正确答案为C。

3、以下哪个工具是专为大数据分布式计算设计的内存计算框架?

A.ApacheSpark

B.PythonPandas

C.NumPy

D.Scikit-learn

【答案】:A

解析:本题考察大数据分布式计算工具知识点。ApacheSpark是基于内存的分布式计算框架,适用于大规模数据处理;PythonPandas、NumPy主要用于单机数据处理与数值计算,Scikit-learn是机器学习库,因此专为分布式计算设计的是Spark,正确选项A。

4、以下哪种数据库系统适合存储结构化数据并支持高并发事务处理?

A.MongoDB

B.MySQL

C.Redis

D.HBase

【答案】:B

解析:本题考察数据存储系统适用场景,正确答案为B。MySQL是关系型数据库,适合结构化数据(如用户表)和高并发事务(ACID特性);A选项MongoDB是非关系型文档数据库,适合半结构化数据;C选项Redis是内存缓存数据库,非结构化数据存储;D选项HBase是列存储数据库,适用于海量非结构化数据(如日志)。因此B选项正确。

5、以下哪种属于大数据分析中常用的无监督学习算法?

A.线性回归

B.K-means聚类

C.决策树分类

D.贝叶斯分类

【答案】:B

解析:本题考察大数据分析算法知识点。K-means聚类是典型的无监督学习算法,用于将数据自动分组(簇),无需预先标记;线性回归、决策树分类、贝叶斯分类均属于监督学习算法,需要有标注的训练数据。因此正确答案为B。

6、Hadoop生态系统中,负责分布式存储的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责海量数据的分布式存储;MapReduce是分布式计算框架,YARN负责集群资源管理,Hive提供数据仓库查询接口。因此正确答案为A。

7、大数据技术通常依赖的核心计算模式是?

A.分布式计算(DistributedComputing)

B.云计算(CloudComputing)

C.网格计算(GridComputing)

D.并行计算(ParallelComputing)

【答案】:B

解析:本题考察大数据与云计算的关系。云计算通过虚拟化、弹性资源池等特性,为大数据处理提供了可扩展的计算、存储和网络资源,是大数据技术的典型支撑平台;选项A的分布式计算是技术方法(如Hadoop的核心),但需依托云计算实现大规模资源调度;选项C的网格计算是早期分布式计算模式,与现代大数据技术关联性较弱;选项D的并行计算是提高效率的手段,需结合云计算平台。因此,大数据技术通常依赖云计算作为核心计算模式,正确答案为B。

8、数据清洗是大数据预处理的重要步骤,其主要目的是?

A.去除数据中的噪声和错误值(如缺失值、异常值)

B.提高数据存储的压缩率

C.加速数据在网络中的传输速度

D.优化数据在数据库中的索引结构

【答案】:A

解析:本题考察数据预处理中数据清洗的知识点。数据清洗的核心是提升数据质量,通过处理缺失值、异常值、重复数据等“噪声和错误值”实现;B(压缩率)、C(传输速度)、D(索引结构优化)均不属于数据清洗的直接目的,因此正确选项A。

9、以下哪项不属于大数据的4V特征?

A.Volume(数据量)

B.Velocity(速度)

C.Variety(多样性)

D.Variability(变异性)

【答

文档评论(0)

1亿VIP精品文档

相关文档