- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
南开大学2025年9月《大数据开发技术》作业考核试题及答案参考
一、单项选择题(每题2分,共20分)
1.在Hadoop生态中,负责资源管理与任务调度的组件是
A.HDFS??B.YARN??C.MapReduce??D.Hive
答案:B
2.下列哪条Spark算子会触发Shuffle操作
A.map??B.filter??C.reduceByKey??D.collect
答案:C
3.关于Parquet文件格式,描述错误的是
A.列式存储??B.自带Schema??C.支持谓词下推??D.只支持JavaAPI
答案:D
4.Kafka中保证消息顺序的最小单元是
A.Broker??B.Topic??C.Partition??D.ConsumerGroup
答案:C
5.Flink的Checkpoint机制基于哪种分布式一致性协议
A.Raft??B.Chandy-Lamport??C.Two-PhaseCommit??D.Paxos
答案:B
6.在HBase中,用于实现二级索引的常用方案是
A.Coprocessor??B.BloomFilter??C.MemStore??D.WAL
答案:A
7.使用SparkMLlib训练GBDT模型时,可调的参数不包括
A.maxDepth??B.stepSize??C.numIterations??D.regParam
答案:B
8.下列哪种存储格式最适合支持OLAP场景的交互式查询
A.ORC??B.SequenceFile??C.TextFile??D.Avro
答案:A
9.在数据湖架构中,提供ACID语义并支持行级更新的开源组件是
A.DeltaLake??B.Alluxio??C.Livy??D.Knox
答案:A
10.当Spark作业频繁出现executorlost,应优先检查的指标是
A.StorageMemory??B.ShuffleRead??C.GCTime??D.RecordsRead
答案:C
二、多项选择题(每题3分,共15分)
11.以下哪些属于Flink的StateBackend实现
A.MemoryStateBackend??B.FsStateBackend??C.RocksDBStateBackend??D.HdfsStateBackend
答案:A、B、C
12.关于HiveonSpark与HiveonTez对比,正确的有
A.前者复用Spark引擎??B.后者支持更细粒度并行??C.前者SQL兼容性更好??D.后者小文件合并能力更强
答案:A、B、D
13.使用KafkaConnect进行数据入湖时,可配置的转换器包括
A.JSONConverter??B.AvroConverter??C.ProtobufConverter??D.CSVConverter
答案:A、B、C
14.在SparkStructuredStreaming中,支持的内置输出模式有
A.Append??B.Update??C.Complete??D.Merge
答案:A、B、C
15.以下哪些操作会触发Spark的Job提交
A.count??B.saveAsTextFile??C.take??D.persist
答案:A、B、C
三、判断题(每题1分,共10分)
16.HDFS的NameNode高可用方案中,ZKFC进程负责监控NameNode健康状态并触发主备切换。
答案:√
17.Spark的RDD一旦持久化到磁盘,后续所有算子均不再重新计算。
答案:×
18.Flink的EventTime处理必须指定Watermark生成策略,否则无法触发窗口计算。
答案:√
19.ORC格式的StripeFooter中保存了列的统计信息,可用于剪枝优化。
答案:√
20.Kafka的ConsumerOffset由Zookeeper直接管理,Broker不参与。
答案:×
21.HBase的RegionServer宕机后,其负责的Region必须由Master重新分配。
答案:√
22.DeltaLake的TimeTravel功能依赖事务日志,默认保留30天。
答案:√
23.SparkSQL的Catalyst优化器支持规则优化与代
您可能关注的文档
- 设备安装质量保证方法.docx
- 施工方案及技术措施.docx
- 施工机械安全保证措施方案.docx
- 市政道路施工中的技术难点与对策分析.docx
- 外墙粉刷工程施工方案(通用2篇).docx
- 物资采购质量保证措施.docx
- 职称的考试题库及答案2025年.docx
- 《学校食品安全管理与操作规范》学校食堂从业人员培训工作总结.docx
- 2025版机动车驾驶人安全文明操作规范.docx
- 2025年焊工证考试试题(附答案+解析).docx
- 中国国家标准 GB 14287.5-2025电气火灾监控系统 第5部分:测量热解粒子式电气火灾监控探测器.pdf
- 《GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存》.pdf
- GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求.pdf
- 《GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求》.pdf
- 《GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备》.pdf
- GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备.pdf
- GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
- 中国国家标准 GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
最近下载
- ISO--14644-1-2015-中文版本文档.pdf VIP
- 氧化铝公司基建施工验收手册.doc VIP
- 2025重庆永川区来苏镇关于村社区专职干部招录8人备考题库完美版.docx VIP
- 北京外国语大学《大学英语》2003年真题.docx VIP
- 2025重庆永川区来苏镇关于村社区专职干部招录8人备考题库汇编.docx VIP
- 新高一必修1第四单元课文+翻译 .pdf VIP
- 华为内部控制手册.pdf VIP
- 全国翻译专业资格(水平)考试--CATTI精品课件.ppt VIP
- HJ 169-2018 建设项目环境风险评价技术导则.docx VIP
- 浙江专升本英语真题 铭远教育 2014年浙江专升本英语真题.doc VIP
原创力文档


文档评论(0)