- 1
- 0
- 约2.42万字
- 约 38页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、大数据的5V特征中,“Velocity”指的是?
A.数据处理的速度(数据产生和流动的速度)
B.数据的规模(数据量大小)
C.数据的多样性(结构化与非结构化数据并存)
D.数据的价值密度(数据蕴含的价值)
【答案】:A
解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。
2、以下哪个是典型的大数据批处理计算框架?
A.MapReduce
B.SparkStreaming
C.ApacheFlink
D.ApacheStorm
【答案】:A
解析:本题考察大数据计算框架类型。MapReduce是Hadoop生态系统中经典的批处理计算框架,适用于离线、大规模数据处理;SparkStreaming、Flink、Storm均以实时流处理为核心设计(可处理批处理但非典型批处理框架)。因此正确答案为A。
3、关于数据仓库(DataWarehouse)和数据集市(DataMart)的描述,正确的是?
A.数据集市是面向企业整体的,数据仓库是面向部门的
B.数据集市的数据来源于数据仓库
C.数据仓库通常存储细节数据,数据集市仅存储汇总数据
D.数据仓库规模较小,数据集市规模较大
【答案】:B
解析:本题考察数据仓库与数据集市的概念区别。数据集市是数据仓库的子集,其数据来源于数据仓库(通常是从数据仓库中抽取特定业务部门所需的数据);A选项混淆了两者的面向范围(数据仓库面向企业整体,数据集市面向部门);C选项错误(数据集市也可存储细节数据);D选项错误(数据仓库规模通常更大)。因此正确答案为B。
4、以下哪种数据库属于非关系型数据库(NoSQL数据库)?
A.MySQL
B.Oracle
C.MongoDB
D.SQLServer
【答案】:C
解析:本题考察关系型与非关系型数据库知识点。关系型数据库(如A选项MySQL、B选项Oracle、D选项SQLServer)基于关系模型,使用表格结构和SQL语言进行操作,具有严格的表结构和关系约束;C选项MongoDB是文档型NoSQL数据库,属于非关系型数据库,以键值对或文档(如JSON格式)存储数据,灵活扩展,适合非结构化数据存储。因此正确答案为C。
5、在大数据处理流程中,“去除重复数据、处理缺失值、修正异常值”属于以下哪个步骤?
A.数据集成
B.数据清洗
C.数据转换
D.数据规约
【答案】:B
解析:本题考察大数据预处理步骤的定义。数据清洗(B选项)的主要目的是处理数据质量问题,包括去除重复记录、填补缺失值、修正异常值等;数据集成(A选项)是合并多源数据;数据转换(C选项)是对数据格式或结构进行标准化处理;数据规约(D选项)是通过降维等方式减少数据规模。因此正确步骤为数据清洗。
6、以下哪个工具是专为大数据分布式计算设计的内存计算框架?
A.ApacheSpark
B.PythonPandas
C.NumPy
D.Scikit-learn
【答案】:A
解析:本题考察大数据分布式计算工具知识点。ApacheSpark是基于内存的分布式计算框架,适用于大规模数据处理;PythonPandas、NumPy主要用于单机数据处理与数值计算,Scikit-learn是机器学习库,因此专为分布式计算设计的是Spark,正确选项A。
7、在决策树算法中,ID3算法用于选择最优分裂特征时采用的指标是?
A.信息增益
B.信息增益比
C.基尼指数
D.均方误差
【答案】:A
解析:本题考察决策树算法的核心指标。决策树分裂特征选择是关键:ID3算法基于信息熵,使用“信息增益”(选项A)衡量特征对分类的贡献;C4.5算法优化为“信息增益比”(选项B)以解决信息增益偏向多值特征的问题;CART算法(分类与回归树)采用“基尼指数”(选项C);均方误差(选项D)是回归问题中(如线性回归)衡量预测误差的指标,与决策树无关。因此ID3算法使用信息增益选择分裂特征。
8、以下关于NoSQL数据库的描述,正确的是?
A.NoSQL数据库只能存储结构化数据
B.NoSQL数据库通常不严格遵循ACID事务特性
C.NoSQL数据库仅支持单机部署,无法分布式扩展
D.NoSQL数据库的查询语言与SQL完全相同
【答案】:B
解析:本题考察NoSQL数据库特性知识点。NoSQL(非关系型数据库)的特点:A错误
您可能关注的文档
- 2026年国开电大当代中国政治制度形考题库100道附完整答案(必刷).docx
- 2026年国开电大当代中国政治制度形考题库100道及参考答案(研优卷).docx
- 2026年国开电大当代世界经济与政治形考题库100道有完整答案.docx
- 2026年国开电大当代世界经济与政治形考题库100道及完整答案(夺冠).docx
- 2026年国开电大导游业务形考题库100道含完整答案(名校卷).docx
- 2026年国开电大导游业务形考题库100道【轻巧夺冠】.docx
- 2026年国开电大大数据技术概论形考题库100道含完整答案【名校卷】.docx
- 2026年国开电大大作业形考题库100道附参考答案(综合题).docx
- 2026年国开电大大作业形考题库100道【含答案】.docx
- 2026年国开电大创新思维训练与方法形考题库100道附答案(研优卷).docx
- 河北盐山中学等校2025-2026学年上学期高三一模化学试卷(含解析).docx
- 河北正定中学2025-2026学年高一上学期期末考试物理试卷(含解析).docx
- 河北张家口市怀安县2025-2026学年第一学期期末教学综合评价八年级地理试卷(含解析).docx
- 河南安阳市殷都区2025-2026学年第一学期期末教学质量检测七年级地理试卷(含解析).docx
- 河南安阳市滑县2025一2026学年第一学期期末学业质量监测八年级地理试题(含解析).docx
- 河南安阳市林州市2025-2026学年上学期期末考试高一政治试题(含解析).docx
- 河南焦作市武陟县第一中学2025-2026学年高一上学期1月月考语文试卷(含解析).docx
- 河南济源市2025-2026学年上学期期末学业质量调研七年级历史试卷(含解析).docx
- PICC导管并发症的紧急处理与护理.pptx
- 河南鹤壁市2025-2026学年高二上学期期末考试生物试题(含解析).docx
最近下载
- (新版)架子工高级理论知识题库.docx VIP
- 跨越分数+拥抱成长+课件--2025-2026学年高二上学期考后心理调适主题班会.pptx VIP
- 专业功放测试条件和标准.doc
- 2025年河北语文中考试卷真题及答案.pdf VIP
- 经皮肾镜取石术相关尿脓毒症.ppt
- 【国联民生-2026研报】前瞻研究系列报告:序曲的终章:战争中的财富“庇护所”.pdf VIP
- 浙江省执业医师注册健康体检表(新).docx VIP
- 2025-2026学年高二上学期《内外兼修,与时偕行——探寻成长的力量之源》主题班会课件.pptx VIP
- 成人吞咽障碍患者口服给药护理-2025中华护理学会团体标准.pptx VIP
- 八上必读名著《昆虫记》中考真题(含答案).docx VIP
原创力文档

文档评论(0)