2026年国开电大大数据技术概论形考题库100道【巩固】.docxVIP

  • 0
  • 0
  • 约2.48万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道【巩固】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪项属于大数据可视化工具?

A.Photoshop

B.Tableau

C.MySQL

D.WinRAR

【答案】:B

解析:本题考察大数据可视化工具的识别。大数据可视化工具用于将复杂数据转化为直观图表,选项中:A.Photoshop是图像编辑软件,非可视化工具;B.Tableau是专业的交互式数据可视化工具,支持多种图表类型;C.MySQL是关系型数据库管理系统,用于数据存储;D.WinRAR是压缩软件,均不符合。因此正确答案为B。

2、ApacheSpark相比HadoopMapReduce的主要优势体现在?

A.处理速度更快(内存计算为主)

B.仅支持批处理任务(无法流处理)

C.不支持内存计算(依赖磁盘IO)

D.只能处理结构化数据(不支持非结构化)

【答案】:A

解析:本题考察Spark与MapReduce的技术差异。正确答案为A,Spark以内存计算为核心,将中间结果保存在内存中,避免MapReduce依赖的磁盘IO,因此迭代计算速度远快于MapReduce。B选项错误,Spark支持批处理(SparkSQL)和流处理(StructuredStreaming);C选项错误,Spark核心是内存计算框架;D选项错误,Spark支持结构化、半结构化(JSON)和非结构化(文本、图像)数据处理。因此A是Spark的核心优势。

3、以下哪项是Hadoop生态系统中负责分布式存储的核心组件?

A.HDFS

B.MapReduce

C.Spark

D.YARN

【答案】:A

解析:本题考察Hadoop生态系统的核心组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责海量数据的存储;B选项MapReduce是批处理计算框架,C选项Spark是内存计算框架,D选项YARN是资源管理器,因此正确答案为A。

4、在大数据处理流程中,对数据进行缺失值填充、异常值处理的操作属于以下哪个环节?

A.数据清洗

B.数据集成

C.数据转换

D.数据挖掘

【答案】:A

解析:本题考察大数据预处理环节知识点。数据清洗是对原始数据进行去重、填补缺失值、处理异常值等操作,确保数据质量;数据集成是合并多源数据,数据转换是对数据格式/单位进行标准化,数据挖掘是从数据中提取有价值信息(属于分析阶段)。选项A为正确答案。

5、以下哪项是大数据在电商领域的典型应用?

A.智能交通信号控制

B.电商个性化商品推荐

C.基因序列分析与疾病预测

D.工业机器人故障预警

【答案】:B

解析:本题考察大数据应用场景知识点。电商领域利用用户行为数据(如浏览、购买记录)进行用户画像,实现个性化推荐,属于典型应用。选项A“智能交通”属于交通领域大数据应用;选项C“基因分析”属于医疗/生物信息学;选项D“工业机器人”属于工业物联网应用,均不符合电商场景。

6、以下哪项是大数据在交通领域的典型应用场景?

A.实时路况智能分析与导航推荐

B.电商平台商品智能推荐系统

C.气象部门精准天气预报

D.医院电子病历存储与检索

【答案】:A

解析:本题考察大数据的典型应用场景知识点。实时路况智能分析与导航推荐通过整合交通摄像头、传感器等实时数据,为用户提供动态路线规划,属于交通领域大数据应用;B选项是电商平台的个性化推荐(用户行为分析);C选项是气象大数据的应用(气象监测与预测);D选项是医疗领域的电子病历管理。因此正确答案为A。

7、大数据分析的最终目标是?

A.实现数据的高效存储

B.完成数据的可视化展示

C.从海量数据中发现有价值的信息

D.对数据进行采集和传输

【答案】:C

解析:本题考察大数据分析的核心目标。大数据分析的本质是从海量、多源数据中挖掘潜在规律、趋势或关联,最终实现价值发现(如用户画像、风险预测);数据存储、可视化、采集传输均是处理流程中的环节,而非最终目标。因此正确答案为C。

8、在大数据存储技术中,MongoDB主要适用于存储以下哪种类型的数据?

A.高度结构化的企业财务数据

B.关系复杂的多表关联业务数据

C.非结构化/半结构化数据(如用户评论)

D.需事务一致性的金融交易数据

【答案】:C

解析:本题考察NoSQL数据库的应用场景。MongoDB是典型的文档型NoSQL数据库,适用于存储非结构化或半结构化数据(如JSON格式的用户评论、图片元数据等),具有灵活的模式设计和高扩展性。A、B、D均属于关系型数据库(如MySQL、Oracle)的典型应用场景,强调结构化和事务一致性。因此正确答案为C。

9、大数据的“Ve

文档评论(0)

1亿VIP精品文档

相关文档