- 0
- 0
- 约7.57千字
- 约 8页
- 2026-07-05 发布于上海
- 举报
大数据工程师职业资格
一、单项选择题(共10题,每题1分,共10分)
在Hadoop生态系统中,负责分布式文件存储的组件是()。A.HBaseB.HDFSC.MapReduceD.ZooKeeper答案:B解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心子项目,设计用于在普通硬件上运行的大型集群上存储海量数据。HBase是基于HDFS的分布式列式数据库,MapReduce是分布式计算框架,ZooKeeper是分布式协调服务。
以下哪种算法通常被用于大数据处理中的数据压缩以减少I/O开销()。A.GZIPB.SnappyC.MD5D.SHA-256答案:B解析:GZIP压缩率高但解压慢,MD5和SHA-256是哈希算法用于校验而非压缩。Snappy是Google开发的高吞吐低延迟的压缩算法,适合Hadoop环境,在压缩率和速度之间取得了良好平衡。
在SparkSQL中,用于将DataFrame转换为RDD的函数是()。A.toDF()B.rdd()C.map()D.collect()答案:B解析:DataFrame是Spark1.3引入的分布式数据集,基于RDD封装。rdd()方法可以将DataFrame转换回底层的RDD对象。toDF()是将RDD转换为Da
您可能关注的文档
- 2026年中医养生保健师考试题库(附答案和详细解析)(0527).docx
- 2026年教师资格证考试考试题库(附答案和详细解析)(0616).docx
- 2026年注册安全工程师考试题库(附答案和详细解析)(0612).docx
- 2026年注册投资项目分析师(CIPA)考试题库(附答案和详细解析)(0525).docx
- 2026年渗透测试工程师考试题库(附答案和详细解析)(0602).docx
- FOF基金资产配置与风险管理.docx
- Levy过程驱动的期权定价模型比较.docx
- Premiere考试剪辑题库及答案.docx
- “职场情商”的提升方法与应用.docx
- 丙肝患者的营养支持.docx
- 绵阳市平武县2025届数学四年级第二学期期末联考试题含解析.docx
- 绵阳市三台县2025届三年级数学第二学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学下学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含答案.docx
- 绵阳市三台县2025届四年级数学第一学期阶段模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学第一学期期中模拟试题含答案解析.docx
最近下载
- 2025年高考英语一轮复习讲义—必修一:Unit 1 Back to school(译林版).pdf VIP
- 软件工程卷1:抽象与建模pdf.pdf VIP
- 县级融媒体中心建设模式研究.docx VIP
- 工业机器人技术基础高职全套教学课件.pptx
- 高中语文选择性必修下册必背篇目.docx VIP
- 2026年新高考语文(全国一卷)原卷.pdf VIP
- 译林版新高一英语Unit 1 Back to school同步练习含答案.docx VIP
- 软件工程卷2:系统与语言规约.pdf VIP
- 口服维生素K预防婴儿维生素K缺乏性出血专家共识(2024版).pptx VIP
- 钢筋混凝土盖板涵和圆管涵专项工程施工方案.doc VIP
原创力文档

文档评论(0)