- 0
- 0
- 约3.63千字
- 约 6页
- 2026-03-06 发布于河南
- 举报
2025年(大数据科学与应用)对应科目试题
及答案
分为第I卷(选择题)和第Ⅱ卷(非选择题)两部分,满分100
分,考试时间90分钟。
第I卷(选择题共40分)
答题要求:请将每小题正确答案的序号填在括号内。
一、单项选择题(总共10题,每题2分)
1.大数据的特点不包括以下哪项?()
A.大量化B.多样化C.低价值密度D.高价值密度
2.以下哪种算法常用于数据分类?()
A.K-MeansB.决策树C.支持向量机D.以上都是
3.数据预处理不包括以下哪个步骤?()
A.数据清洗B.数据集成C.数据分析D.数据归约
4.大数据存储的主要方式不包括()
A.分布式文件系统B.云存储C.关系型数据库D.NoSQL数据
库
5.以下哪个是大数据可视化的工具?()
A.TableauB.PythonC.RD.Hadoop
6.机器学习中的监督学习和无监督学习的主要区别在于()
A.是否有标注数据B.算法复杂度C.计算资源需求D.数据规
模
7.数据挖掘的主要任务不包括()
A.分类B.聚类C.数据压缩D.关联规则挖掘
8.大数据安全面临的主要威胁不包括()
A.数据泄露B.数据篡改C.数据备份D.拒绝服务攻击
9.以下哪种编程语言在大数据领域应用广泛?()
A.JavaB.C++C.SQLD.Scala
10.数据仓库的主要特点不包括()
A.面向主题B.集成性C.实时性D.稳定性
答案:1.D2.D3.C4.C5.A6.A7.C8.C9.D10.C
二、多项选择题(总共10题,每题2分)
1.大数据的应用领域包括()
A.金融B.医疗C.教育D.交通
2.常用的数据集成方法有()
A.数据抽取B.数据转换C.数据装载D.数据清洗
3.以下哪些是分布式计算框架?()
A.MapReduceB.SparkC.FlinkD.HBase
4.数据挖掘中的关联规则挖掘算法有()
A.AprioriB.FP-GrowthC.K-MeansD.决策树
5.大数据可视化的原则包括()
A.简洁明了B.突出重点C.交互性D.色彩协调
6.机器学习中的模型评估指标有()
A.准确率B.召回率C.F1值D.均方误差
7.数据预处理中数据清洗可以处理的问题有()
A.缺失值B.重复值C.错误值D.噪声数据
8.大数据安全防护的措施包括()
A.加密技术B.访问控制C.入侵检测D.数据备份
9.以下哪些是大数据存储系统?()
A.HadoopDistributedFileSystem(HDFS)B.CassandraC.
MongoDBD.Redis
10.数据仓库的数据来源包括()
A.业务系统数据B.外部数据C.历史数据D.实时数据
答案:1.ABCD2.ABC3.ABC4.AB5.ABCD6.AB
您可能关注的文档
最近下载
- 广发证券-海量LEVEL2数据因子挖掘系列(一)-多维度解耦的94个大小单因子.pdf
- 软件测试-山东职业院校技能大赛.pdf VIP
- 建筑装修-内装修(变形缝窗台及窗帘配件)---甘12J1-4.pdf VIP
- 2019年上海市初中学生学业考试生命科学试卷.doc VIP
- 海量Level 2数据因子分析报告:牛市中的市价订单与相关因子.pdf VIP
- 传承五四薪火不负青春时光五四青年节主题班会课件.pptx VIP
- 吃喝违规研讨发言(3篇).docx VIP
- 孕产妇围分娩期预防性使用抗菌药物的专家共识.pptx VIP
- JT∕T 1389.2-2021 交通运输视频图像文字信息标注规范 第2部分:高速公路.pdf
- 商务英语入门第四章_外教社修订版.ppt VIP
原创力文档

文档评论(0)