- 0
- 0
- 约2.56万字
- 约 39页
- 2026-03-10 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、以下哪种算法属于聚类算法?
A.Apriori(关联规则挖掘)
B.K-Means(无监督聚类)
C.SVM(支持向量机)
D.LinearRegression(线性回归)
【答案】:B
解析:K-Means是典型的无监督学习聚类算法,用于将数据自动分组为不同簇。Apriori用于关联规则挖掘,SVM是分类算法,LinearRegression是预测算法,均不属于聚类算法,因此正确答案为B。
2、大数据的4V特征中,不包括以下哪一项?
A.多样性(Variety)
B.可变性(Variability)
C.速度(Velocity)
D.价值(Value)
【答案】:B
解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。
3、以下关于NoSQL数据库的描述,正确的是?
A.NoSQL数据库只能存储结构化数据
B.NoSQL数据库通常不严格遵循ACID事务特性
C.NoSQL数据库仅支持单机部署,无法分布式扩展
D.NoSQL数据库的查询语言与SQL完全相同
【答案】:B
解析:本题考察NoSQL数据库特性知识点。NoSQL(非关系型数据库)的特点:A错误,NoSQL支持非结构化(如文档、图片)、半结构化数据,而SQL主要处理结构化数据;B正确,NoSQL为提高扩展性,通常弱化ACID(如BASE理论),不严格遵循原子性、一致性等特性;C错误,NoSQL支持分布式部署(如MongoDB分片),可横向扩展;D错误,NoSQL查询语言多样(如MongoDB的BSON查询、Redis的键值对查询),与SQL语法不同。因此选B。
4、Hadoop生态系统中负责分布式存储的核心组件是?
A.MapReduce
B.YARN
C.HDFS
D.Hive
【答案】:C
解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专门负责海量数据的分布式存储;MapReduce是分布式计算框架,用于并行处理大数据;YARN是资源管理器,负责集群资源调度;Hive是基于Hadoop的数据仓库工具,用于数据仓库建模和查询。因此正确答案为C。
5、关于数据仓库与数据湖的区别,以下说法正确的是?
A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据
B.数据仓库存储实时数据,数据湖仅存储历史数据
C.数据仓库适合实时分析,数据湖适合离线批处理分析
D.数据仓库和数据湖本质上没有区别,仅为名称差异
【答案】:A
解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。
6、HDFS默认情况下,为每个数据块存储的副本数量是?
A.1
B.2
C.3
D.4
【答案】:C
解析:本题考察HDFS副本机制知识点。HDFS为保障数据可靠性和容错性,默认将每个数据块存储3个副本在不同节点,即使单个节点故障,数据仍可通过其他副本恢复;1个副本无容错能力,2个副本容错性较低,4个副本超出常规默认配置。因此正确答案为C。
7、通过历史数据预测未来趋势的分析属于大数据分析的哪种类型?
A.描述性分析
B.预测性分析
C.规范性分析
D.探索性分析
【答案】:B
解析:本题考察大数据分析类型知识点,预测性分析通过历史数据建模预测未来趋势;描述性分析主要总结历史数据(如报表、统计);规范性分析通过优化算法给出最优决策建议;探索性分析用于发现数据中的潜在模式或关系。因此正确答案为B。
8、Hadoop分布式文件系统HDFS的主要特点不包括以下哪项?
A.采用分块(Block)方式存储超大规模文件
B.支持高容错性,单节点故障不影响整体服务
C.适合存储和处理TB/PB级别的大文件
D.支持实时性要求高的低延迟数据写入操作
【答案】:D
解析:本题考察Hadoop分布式文件系统(HDFS)的核心特点。HDFS的设计目标是存储和处理超大规模数据,其特点包括:采用分块(默认64MB/128MB)存储大文件(选项A、C正确);通过副本机制实现高容错性(选项B正确)。而HDFS采用“一次写入
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道附完整答案【网校专用】.docx
- 2026年国开电大道路工程技术形考题库100道及参考答案一套.docx
- 2026年国开电大当代中国政治制度形考题库100道附参考答案【基础题】.docx
- 2026年国开电大当代世界经济与政治形考题库100道含答案(最新).docx
- 2026年国开电大导游业务形考题库100道附参考答案【突破训练】.docx
- 2026年国开电大导游业务形考题库100道及答案【考点梳理】.docx
- 2026年国开电大大数据技术概论形考题库100道附参考答案【达标题】.docx
- 2026年国开电大大数据技术概论形考题库100道【黄金题型】.docx
- 2026年国开电大大作业形考题库100道附答案【实用】.docx
- 2026年国开电大大作业形考题库100道含完整答案(必刷).docx
最近下载
- 人教版道德与法治三年级下册第3课《一切靠劳动》 课件.pptx VIP
- 建设银行供应链金融业务的战略突破与创新发展.docx
- 大赛独家代理授权合作协议范文.docx VIP
- 抗高压药物行业调研报告.pptx
- 人教版中考数学知识点总结.pdf VIP
- 宣贯培训(2026年)《GBT 39559.2-2020城市轨道交通设施运营监测技术规范 第2部分:桥梁》.pptx VIP
- 来实SEAM-LOK75直立锁边板手册-BlueScope.PDF VIP
- Formel-Q-V8(质量能力-软件).pdf VIP
- 《300MW汽轮发电机组厂用电设计论文》.doc VIP
- 《工程伦理》教案全套-教学设计.docx
原创力文档

文档评论(0)