2026年大数据学习大数据实操题.docxVIP

  • 1
  • 0
  • 约1.76千字
  • 约 4页
  • 2026-02-27 发布于河北
  • 举报

2026年大数据学习大数据实操题

考试时间:______分钟总分:______分姓名:______

1.基础理论题

(1)大数据通常指的是数据量超过什么级别的数据?

A.1TB

B.10TB

C.100TB

D.1PB

(2)大数据的三大特征是哪三个?

A.复杂性、多样性、实时性

B.大规模、多样性、实时性

C.大规模、低价值密度、实时性

D.大规模、低价值密度、多样性

(3)Hadoop生态系统中,用于数据存储的是哪个组件?

A.HDFS

B.YARN

C.MapReduce

D.HBase

2.数据采集题

(1)以下哪个不是常用的网络爬虫框架?

A.Scrapy

B.BeautifulSoup

C.Selenium

D.Pandas

(2)以下哪个API是用来获取天气信息的?

A.OpenWeatherMap

B.GoogleMapsAPI

C.TwitterAPI

D.FacebookAPI

3.数据处理题

(1)以下哪个命令可以启动Hadoop集群中的NameNode?

A.start-dfs.sh

B.start-yarn.sh

C.start-mapreduce.sh

D.start-hbase.sh

(2)以下哪个操作可以将数据从本地文件系统上传到HDFS?

A.hdfsdfs-putlocalfilehdfsfile

B.hdfsdfs-gethdfsfilelocalfile

C.hdfsdfs-copyFromLocallocalfilehdfsfile

D.hdfsdfs-copyToLocalhdfsfilelocalfile

4.数据存储题

(1)以下哪个不是NoSQL数据库?

A.MongoDB

B.Redis

C.MySQL

D.Cassandra

(2)HBase的表结构通常由哪些部分组成?

A.表名、行键、列族、列限定符

B.表名、行键、列族、行限定符

C.表名、列族、列限定符、行限定符

D.表名、列族、行键、列限定符

5.数据分析题

(1)以下哪个不是Python中常用的数据分析库?

A.NumPy

B.Pandas

C.Scikit-learn

D.Matplotlib

(2)以下哪个操作可以读取CSV文件到PandasDataFrame中?

A.df=pd.read_csv(file.csv)

B.df=pd.read_excel(file.xlsx)

C.df=pd.read_json(file.json)

D.df=pd.read_html(file.html)

6.数据可视化题

(1)以下哪个不是常用的数据可视化库?

A.Matplotlib

B.Seaborn

C.D3.js

D.jQuery

(2)以下哪个操作可以在Python中使用Matplotlib绘制散点图?

A.plt.scatter(x,y)

B.plt.plot(x,y)

C.plt.bar(x,y)

D.plt.pie(y)

试卷答案

1.B

解析:大数据通常指的是数据量超过10TB的数据。

2.A

解析:Hadoop生态系统中,HDFS用于数据存储。

3.A

解析:hdfsdfs-putlocalfilehdfsfile命令可以将本地文件系统中的文件上传到HDFS。

4.C

解析:HBase的表结构通常由表名、列族、列限定符、行限定符组成。

5.C

解析:Scikit-learn是Python中常用的机器学习库。

6.B

解析:plt.scatter(x,y)是Matplotlib中绘制散点图的函数。

文档评论(0)

1亿VIP精品文档

相关文档