2025年专业技术人员公需科目必修课考试试题(含答案)大数据应用驱动智能.docxVIP

2025年专业技术人员公需科目必修课考试试题(含答案)大数据应用驱动智能.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年专业技术人员公需科目必修课考试试题(含答案)大数据应用驱动智能

一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项的字母填在括号内)

1.在Hadoop生态中,负责资源调度与任务监控的组件是()

A.HDFS??B.YARN??C.MapReduce??D.Hive

2.下列哪项技术最适合对高速流式数据进行毫秒级复杂事件处理()

A.SparkStreaming??B.Flink??C.Storm??D.Kafka

3.某电商公司利用协同过滤算法做商品推荐,其核心思想是()

A.基于内容相似度??B.基于用户行为相似度??C.基于专家规则??D.基于知识图谱

4.在数据治理框架中,元数据管理的首要目标是()

A.降低存储成本??B.提升查询性能??C.保证数据可发现与可理解??D.实现数据脱敏

5.某市交通大脑通过融合出租车GPS、地铁闸机、天气、节假日四类数据预测拥堵,其采用的融合层级属于()

A.数据级融合??B.特征级融合??C.决策级融合??D.语义级融合

6.在深度学习中,LSTM单元相比传统RNN的主要改进是()

A.引入残差连接??B.引入门控机制缓解梯度消失??C.采用卷积核提取局部特征??D.使用注意力机制

7.某银行使用XGBoost做信用卡欺诈检测,下列哪项调参策略最可能降低过拟合()

A.增大learning_rate??B.减小max_depth??C.减小subsample??D.增大n_estimators

8.在数据仓库建模中,星型模式与雪花模式的关键差异在于()

A.是否使用事实表??B.维度表是否规范化??C.是否支持增量更新??D.是否支持OLAP

9.某省政务云采用数据沙箱技术开放企业注册数据,其核心安全机制是()

A.差分隐私??B.同态加密??C.隔离计算与结果审核??D.区块链存证

10.下列关于DataLakehouse的描述正确的是()

A.仅支持结构化数据??B.事务一致性弱于传统数据仓库??C.统一存储层上实现湖仓一体??D.不支持SQL查询

11.在联邦学习场景下,参与方梯度上传前进行梯度裁剪的主要目的是()

A.提升模型精度??B.防止成员推理攻击??C.降低通信开销??D.加速收敛

12.某短视频平台使用双塔模型做召回,负样本采样策略采用“batch内负采样”的优点是()

A.节省存储??B.提升多样性??C.加速训练且保证一致性??D.降低冷启动影响

13.在数据质量管理工具中,数据血统(DataLineage)主要用于解决()

A.数据冗余??B.数据不一致??C.数据溯源??D.数据倾斜

14.某制造企业在边缘网关部署TensorRT对质检模型进行推理加速,其核心技术是()

A.量化与图优化??B.数据并行??C.模型蒸馏??D.参数服务器

15.下列关于KafkaPartition机制的描述错误的是()

A.每个Partition内部消息有序??B.Partition数决定最大并行度??C.消费者组内每个分区只能被一个消费者实例消费??D.增加Partition会改变已有消息顺序

16.某市政府利用知识图谱技术构建“企业—人员—事件”图谱,在图数据库中高效查找“二度关系”应使用的算子是()

A.ShortestPath??B.PageRank??C.K-hop??D.Louvain

17.在数据资产估值体系中,数据稀缺性指标主要影响()

A.市场价值??B.内在价值??C.成本价值??D.经济寿命

18.某医疗AI公司使用联邦学习训练肺结节识别模型,其采用的SecureAggregation协议可防止()

A.模型投毒??B.梯度泄露??C.数据漂移??D.标签翻转

19.在Spark中,下列哪一操作会引起宽依赖()

A.map??B.filter??C.union??D.groupByKey

20.某零售企业通过AB测试验证推荐算法效果,试验周期两周后发现实验组GMV提升2.8%,p值=0.045,可初步认为()

A.差异显著,可全量发布??B.差异不显著,需延长周期??C.差异显著但需计算置信区间??D.无法判断

21.在数据安全分类分级规范中,个人信息敏感级别最高的类别是()

A.可间接识别??B.可单独识别??C.不可识别??D.匿名化

22.某省大数据中心采用DataFabric架构,其关键能力是()

A.数据物理集中??B.逻辑统一访问??C.强制S

文档评论(0)

189****1111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档