数据科学与大数据技术题库及答案.docxVIP

  • 5
  • 0
  • 约8.76千字
  • 约 23页
  • 2026-06-10 发布于江苏
  • 举报

数据科学与大数据技术题库及答案

一、单项选择题(共10题,每题1分,共10分)

下列关于Python中列表(List)和元组(Tuple)的描述,正确的是?

A.列表和元组都可以随意修改元素值

B.列表使用圆括号定义,元组使用方括号定义

C.元组的元素不可修改,适合存储固定数据

D.列表的访问速度比元组更快

答案:C

解析:正确选项依据:元组是不可变序列,一旦创建后元素值无法修改,适合存储无需变更的固定数据。错误选项问题:A选项中列表可修改,元组不可修改;B选项中列表用方括号,元组用圆括号;D选项中元组的访问速度比列表更快,因为其不可变的特性使得内存分配更稳定。

Hadoop分布式文件系统(HDFS)的核心设计目标是?

A.支持低延迟的数据访问

B.存储大量小文件

C.为大规模数据提供高吞吐量的存储和访问

D.替代关系型数据库

答案:C

解析:正确选项依据:HDFS专为TB级甚至PB级的大规模数据设计,通过分块存储和并行访问实现高吞吐量。错误选项问题:A选项HDFS不适合低延迟场景,延迟较高;B选项HDFS对小文件存储效率低,会占用大量NameNode内存;D选项HDFS是存储系统,无法替代数据库的计算和查询功能。

Spark中弹性分布式数据集(RDD)的核心特性不包括?

A.可序列化

B.不可变

C.可分区

D.实时更新

答案:D

解析:正确选项依据:RD

文档评论(0)

1亿VIP精品文档

相关文档