西安科技大学高新学院《大数据技术与应用》2024-----2025学年期末试卷(A卷).pdfVIP

西安科技大学高新学院《大数据技术与应用》2024-----2025学年期末试卷(A卷).pdf

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

西安科技大学高新学院

《大数据技术与应用学年期末试卷(A卷)

专业班级姓名学号

复核

题号一二三四五六七八九十成绩

签字

得分

登分

签字

说明:本试卷共100分;答题要求:按要求答题

考生须知:

1.姓名、学号、系、专业、年级、班级必须写在密封线内指定位置。

2.答案必须用蓝、黑色钢笔或圆珠笔写在试卷上,字迹要清晰,卷面要整洁,写在草稿

纸上的一律无效。

一、单项选择题(本大题共15小题,每小题2分,共30分)

在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并填

涂在答题卡相应位置。

1.大数据的4V特性不包括()

A.海量性(Volume)B.高速性(Velocity)C.单一性(Uniformity)D.

价值性(Value)

2.下列属于分布式文件系统的是()

A.MySQLB.HDFSC.RedisD.MongoDB

3.Spark中用于实时数据处理的核心组件是()

A.SparkSQLB.SparkStreamingC.MLlibD.GraphX

4.下列不属于数据采集工具的是()

A.FlumeB.KafkaC.HBaseD.Sqoop

5.数据湖仓一体(DataLakehouse)架构的核心优势是()

A.仅支持结构化数据存储B.融合数据湖的灵活性与数据仓库的管理能力

C.完全依赖本地存储设备D.不支持AI模型直接访问数据

6.HadoopMapReduce编程模型中,Map阶段的主要作用是()

A.数据聚合与汇总B.数据分片与转换C.任务调度与资源分配D.数据存

储与备份

7.下列属于非关系型数据库(NoSQL)的是()

A.OracleB.PostgreSQLC.MongoDBD.SQLServer

8.2025年企业大数据架构趋势中,私有大语言模型(LLM)逐渐取代公有LLM的

核心原因是()

A.部署成本更低B.数据隐私保护更可靠C.无需训练即可使用D.仅支持

文本数据处理

9.Flink相较于传统批处理框架的显著特点是()

A.基于事件驱动的流处理B.仅支持离线数据计算C.依赖Hadoop集群运

行D.不支持状态管理

10.数据清洗过程中,用于处理缺失值的常用方法不包括()

A.删除法B.填充法C.忽略法D.插值法

11.下列关于数据网格(DataMesh)的说法,正确的是()

A.强调数据集中式管理B.按业务域划分数据所有权C.不支持跨域数据共

享D.依赖单一存储系统

12.用于大数据可视化的常用工具是()

A.SparkB.HiveC.TableauD.Flume

13.生成式AI应用中,大数据技术的核心支撑作用是()

A.仅提供文本数据存储B.保障训练数据的质量与规模

C.替代AI模型训练过程D.降低硬件计算成本

14.下列属于Kafka核心组件的是()

A.NameNodeB.DataNodeC.BrokerD.ResourceManager

15.企业采用多云数据架构的主要目的是()

A.减少数据存储量B.实现数据跨环境无缝迁移与访问

C.降低数据安全性D.简化架构复杂度

二、填空题(本大题共5小题,每小题3分,共15分)

请将答案填写在答题卡相应位置。

16.大数据处理流程主要包括数据采集、___________、___________和数据应用四个阶

段,其中___________阶段需完成数据去重、异常值处理等操作。

17.Hadoop生态系统的核心组件包括H

您可能关注的文档

文档评论(0)

资料分享 + 关注
实名认证
文档贡献者

资料分享

1亿VIP精品文档

相关文档