后端开发工程师(大数据)岗位招聘考试试卷及答案.docVIP

后端开发工程师(大数据)岗位招聘考试试卷及答案.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

后端开发工程师(大数据)岗位招聘考试试卷及答案

一、填空题(每题1分,共10分)

1.Hadoop框架核心组件包括HDFS、______和MapReduce。(答案:YARN)

2.Spark中常用的分布式数据集是______。(答案:RDD)

3.关系型数据库中,用于查询数据的语句是______。(答案:SELECT)

4.Kafka中消息存储的基本单位是______。(答案:Topic)

5.Hive中创建表的关键字是______。(答案:CREATETABLE)

6.数据挖掘中常见的聚类算法有______。(答案:K-Means)

7.分布式文件系统的特点是高可扩展、容错性______。(答案:强)

8.数据仓库的四个基本特征是面向主题、集成性、稳定性和______。(答案:时变性)

9.Flink是一个______流批一体化的开源平台。(答案:分布式)

10.NoSQL数据库的类型包括键值存储、文档存储、图存储和______。(答案:列族存储)

二、单项选择题(每题2分,共20分)

1.以下哪种不属于Hadoop生态组件?()

A.HiveB.SparkC.TensorFlowD.Sqoop

(答案:C)

2.Spark中RDD的转换操作是()

A.立即执行B.延迟执行C.随机执行D.按需执行

(答案:B)

3.以下哪个是关系型数据库?()

A.MongoDBB.RedisC.MySQLD.Cassandra

(答案:C)

4.Kafka中负责存储消息的组件是()

A.ProducerB.ConsumerC.BrokerD.Zookeeper

(答案:C)

5.Hive中用于加载数据到表的命令是()

A.INSERTB.LOADDATAC.IMPORTD.COPY

(答案:B)

6.以下哪种算法属于监督学习?()

A.K-MeansB.DBSCANC.DecisionTreeD.PCA

(答案:C)

7.数据仓库的构建流程通常不包括()

A.需求分析B.数据建模C.实时计算D.数据加载

(答案:C)

8.Flink中窗口计算的核心概念不包括()

A.时间窗口B.计数窗口C.滑动窗口D.随机窗口

(答案:D)

9.以下哪个不是NoSQL数据库的优势?()

A.高并发读写B.强一致性C.灵活的数据模型D.可扩展性

(答案:B)

10.以下哪种语言常用于大数据开发?()

A.CB.PythonC.PHPD.Java

(答案:D)

三、多项选择题(每题2分,共20分)

1.以下属于Hadoop核心组件功能的有()

A.HDFS负责数据存储B.YARN负责资源管理

C.MapReduce负责数据处理D.Hive负责数据查询

(答案:ABC)

2.Spark可以运行在以下哪些环境中?()

A.StandaloneB.HadoopYARNC.ApacheMesosD.Kubernetes

(答案:ABCD)

3.以下属于关系型数据库操作的有()

A.INSERTB.UPDATEC.DELETED.ALTER

(答案:ABCD)

4.Kafka的特性包括()

A.高吞吐量B.分布式C.可持久化D.低延迟

(答案:ABCD)

5.Hive支持的数据格式有()

A.TEXTFILEB.ORCC.PARQUETD.JSON

(答案:ABC)

6.数据挖掘的常见任务有()

A.分类B.聚类C.关联规则挖掘D.异常检测

(答案:ABCD)

7.数据仓库的建模方法有()

A.星型模型B.雪花模型C.星座模型D.关系模型

(答案:ABC)

8.Flink的窗口类型包括()

A.翻滚窗口B.滑动窗口C.会话窗口D.全局窗口

(答案:ABCD)

9.以下属于NoSQL数据库的有()

A.MongoDBB.RedisC.CouchDBD.Neo4j

(答案:ABCD)

10.大数据开发中常用的工具和框架有()

A.HadoopB.SparkC.FlinkD.Kafka

(答案:ABCD)

四、判断题(每题2分,共20分)

1.Hadoop只能运行在Linux系统上。(×)

2.Spark的RDD不支持持久化。(×)

3.关系型数据库不适合处理海量数据。(×)

4.Kafka中的消息是无序的。(×)

5.Hive中的表和关系型数据库中的表概念完全相同。(×)

6.无监督学习不需要标记数据。(√)

7.数据仓库主要用于事务处理。(×)

8.Flink不支持批处理。(×)

9.NoSQL数据库都不支持事务。(×)

10.大数据开发只需要掌握一种编程语言。(×)

五、简答题(每题5分,共20分)

1.简述Hadoop分布式文件系统(HDFS)的架构

答案:HDFS架构主要由NameNode、DataNode组成。NameNode负责管理文件系统的命名空间,存储文

文档评论(0)

。。 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档