- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
2025年专业技术人员公需科目必修课考试试题(含答案)大数据应用驱动智能
一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项的字母填在括号内)
1.在Hadoop生态中,负责资源调度与任务监控的组件是()
A.HDFS??B.YARN??C.MapReduce??D.Hive
2.下列哪项技术最适合对高速流式数据进行毫秒级复杂事件处理()
A.SparkStreaming??B.Flink??C.Storm??D.Kafka
3.某电商公司利用协同过滤算法做商品推荐,其核心思想是()
A.基于内容相似度??B.基于用户行为相似度??C.基于专家规则??D.基于知识图谱
4.在数据治理框架中,元数据管理的首要目标是()
A.降低存储成本??B.提升查询性能??C.保证数据可发现与可理解??D.实现数据脱敏
5.某市交通大脑通过融合出租车GPS、地铁闸机、天气、节假日四类数据预测拥堵,其采用的融合层级属于()
A.数据级融合??B.特征级融合??C.决策级融合??D.语义级融合
6.在深度学习中,LSTM单元相比传统RNN的主要改进是()
A.引入残差连接??B.引入门控机制缓解梯度消失??C.采用卷积核提取局部特征??D.使用注意力机制
7.某银行使用XGBoost做信用卡欺诈检测,下列哪项调参策略最可能降低过拟合()
A.增大learning_rate??B.减小max_depth??C.减小subsample??D.增大n_estimators
8.在数据仓库建模中,星型模式与雪花模式的关键差异在于()
A.是否使用事实表??B.维度表是否规范化??C.是否支持增量更新??D.是否支持OLAP
9.某省政务云采用数据沙箱技术开放企业注册数据,其核心安全机制是()
A.差分隐私??B.同态加密??C.隔离计算与结果审核??D.区块链存证
10.下列关于DataLakehouse的描述正确的是()
A.仅支持结构化数据??B.事务一致性弱于传统数据仓库??C.统一存储层上实现湖仓一体??D.不支持SQL查询
11.在联邦学习场景下,参与方梯度上传前进行梯度裁剪的主要目的是()
A.提升模型精度??B.防止成员推理攻击??C.降低通信开销??D.加速收敛
12.某短视频平台使用双塔模型做召回,负样本采样策略采用“batch内负采样”的优点是()
A.节省存储??B.提升多样性??C.加速训练且保证一致性??D.降低冷启动影响
13.在数据质量管理工具中,数据血统(DataLineage)主要用于解决()
A.数据冗余??B.数据不一致??C.数据溯源??D.数据倾斜
14.某制造企业在边缘网关部署TensorRT对质检模型进行推理加速,其核心技术是()
A.量化与图优化??B.数据并行??C.模型蒸馏??D.参数服务器
15.下列关于KafkaPartition机制的描述错误的是()
A.每个Partition内部消息有序??B.Partition数决定最大并行度??C.消费者组内每个分区只能被一个消费者实例消费??D.增加Partition会改变已有消息顺序
16.某市政府利用知识图谱技术构建“企业—人员—事件”图谱,在图数据库中高效查找“二度关系”应使用的算子是()
A.ShortestPath??B.PageRank??C.K-hop??D.Louvain
17.在数据资产估值体系中,数据稀缺性指标主要影响()
A.市场价值??B.内在价值??C.成本价值??D.经济寿命
18.某医疗AI公司使用联邦学习训练肺结节识别模型,其采用的SecureAggregation协议可防止()
A.模型投毒??B.梯度泄露??C.数据漂移??D.标签翻转
19.在Spark中,下列哪一操作会引起宽依赖()
A.map??B.filter??C.union??D.groupByKey
20.某零售企业通过AB测试验证推荐算法效果,试验周期两周后发现实验组GMV提升2.8%,p值=0.045,可初步认为()
A.差异显著,可全量发布??B.差异不显著,需延长周期??C.差异显著但需计算置信区间??D.无法判断
21.在数据安全分类分级规范中,个人信息敏感级别最高的类别是()
A.可间接识别??B.可单独识别??C.不可识别??D.匿名化
22.某省大数据中心采用DataFabric架构,其关键能力是()
A.数据物理集中??B.逻辑统一访问??C.强制S
您可能关注的文档
最近下载
- 人教版(2024年新版)七年级上册数学全册教学设计.docx
 - 人教版小学六年级下册数学单元达标测试卷含答案(全册) .pdf VIP
 - 大学英语语法完整版.pdf VIP
 - (正式版)DB15∕T 3652-2024 《沙化土地综合治理技术规程》.docx VIP
 - 入党积极分子考察表(模版)[参照].pdf VIP
 - 2025至2030中国PE保护膜行业运营态势与投资前景调查研究报告.docx VIP
 - 食品营养与健康(第二版)全套PPT课件.pptx
 - 20210112-联合资信-2021年房地产行业信用风险展望:供需平稳降速,行业偿债高峰,房企分化加剧.pdf VIP
 - 湘教版七年级地理上册知识点.pdf VIP
 - 专利申请撰写技巧与注意事项.pptx VIP
 
原创力文档
                        

文档评论(0)