- 1
- 0
- 约1.76千字
- 约 4页
- 2026-02-27 发布于河北
- 举报
2026年大数据学习大数据实操题
考试时间:______分钟总分:______分姓名:______
1.基础理论题
(1)大数据通常指的是数据量超过什么级别的数据?
A.1TB
B.10TB
C.100TB
D.1PB
(2)大数据的三大特征是哪三个?
A.复杂性、多样性、实时性
B.大规模、多样性、实时性
C.大规模、低价值密度、实时性
D.大规模、低价值密度、多样性
(3)Hadoop生态系统中,用于数据存储的是哪个组件?
A.HDFS
B.YARN
C.MapReduce
D.HBase
2.数据采集题
(1)以下哪个不是常用的网络爬虫框架?
A.Scrapy
B.BeautifulSoup
C.Selenium
D.Pandas
(2)以下哪个API是用来获取天气信息的?
A.OpenWeatherMap
B.GoogleMapsAPI
C.TwitterAPI
D.FacebookAPI
3.数据处理题
(1)以下哪个命令可以启动Hadoop集群中的NameNode?
A.start-dfs.sh
B.start-yarn.sh
C.start-mapreduce.sh
D.start-hbase.sh
(2)以下哪个操作可以将数据从本地文件系统上传到HDFS?
A.hdfsdfs-putlocalfilehdfsfile
B.hdfsdfs-gethdfsfilelocalfile
C.hdfsdfs-copyFromLocallocalfilehdfsfile
D.hdfsdfs-copyToLocalhdfsfilelocalfile
4.数据存储题
(1)以下哪个不是NoSQL数据库?
A.MongoDB
B.Redis
C.MySQL
D.Cassandra
(2)HBase的表结构通常由哪些部分组成?
A.表名、行键、列族、列限定符
B.表名、行键、列族、行限定符
C.表名、列族、列限定符、行限定符
D.表名、列族、行键、列限定符
5.数据分析题
(1)以下哪个不是Python中常用的数据分析库?
A.NumPy
B.Pandas
C.Scikit-learn
D.Matplotlib
(2)以下哪个操作可以读取CSV文件到PandasDataFrame中?
A.df=pd.read_csv(file.csv)
B.df=pd.read_excel(file.xlsx)
C.df=pd.read_json(file.json)
D.df=pd.read_html(file.html)
6.数据可视化题
(1)以下哪个不是常用的数据可视化库?
A.Matplotlib
B.Seaborn
C.D3.js
D.jQuery
(2)以下哪个操作可以在Python中使用Matplotlib绘制散点图?
A.plt.scatter(x,y)
B.plt.plot(x,y)
C.plt.bar(x,y)
D.plt.pie(y)
试卷答案
1.B
解析:大数据通常指的是数据量超过10TB的数据。
2.A
解析:Hadoop生态系统中,HDFS用于数据存储。
3.A
解析:hdfsdfs-putlocalfilehdfsfile命令可以将本地文件系统中的文件上传到HDFS。
4.C
解析:HBase的表结构通常由表名、列族、列限定符、行限定符组成。
5.C
解析:Scikit-learn是Python中常用的机器学习库。
6.B
解析:plt.scatter(x,y)是Matplotlib中绘制散点图的函数。
您可能关注的文档
最近下载
- 园区保安服务项目.docx VIP
- 高等教育《管理学》课后习题答案解析.docx VIP
- 25HNTJ026 锯齿形装配式混凝土剪力墙结构施工图制图规则及构造详图 T_HNKCSJ 025-2025.docx VIP
- YY/T 1987-2025采用脑机接口技术的医疗器械 术语.pdf
- 2024年广安职业技术学院高职单招(英语/数学/语文)笔试题库含答案解析.docx VIP
- 2024年广安职业技术学院高职单招(英语/数学/语文)笔试题库含答案解析.docx VIP
- 25HNTJ025 刚节点装配式混凝土框架结构施工图制图规则及构造详图 T_HNKCSJ 024-2025.docx VIP
- 2023年河南法院书记员招聘考试真题 .pdf VIP
- 25HNTJ025 低能耗集成装配式多层房屋构造 T_HNKCSJ 023-2025.docx VIP
- DB11_T 1312-2025 预制混凝土构件质量控制标准.docx VIP
原创力文档

文档评论(0)