2025年AWS认证SnowballEdge与AWSGlue集成专题试卷及解析.pdfVIP

2025年AWS认证SnowballEdge与AWSGlue集成专题试卷及解析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年AWS认证SNOWBALLEDGE与AWSGLUE集成专题试卷及解析1

2025年AWS认证SnowballEdge与AWSGlue集成专

题试卷及解析

2025年AWS认证SnowballEdge与AWSGlue集成专题试卷及解析

第一部分:单项选择题(共10题,每题2分)

1、在AWSSnowballEdge设备上,哪个服务可以直接用于本地数据处理,减少与

AWS云端的往返通信?

A、AWSLambda

B、AWSGlue

C、AmazonS3

D、AmazonEC2

【答案】A

【解析】正确答案是A。AWSSnowballEdge支持AWSLambda函数,允许在设

备上直接运行代码进行本地数据处理,减少数据传输延迟。B选项AWSGlue主要用

于云端ETL作业,C选项AmazonS3是存储服务,D选项AmazonEC2在Snowball

Edge上不可用。知识点:SnowballEdge本地计算能力。易错点:误以为Glue可以在

Edge设备上运行。

2、当使用AWSGlue处理SnowballEdge传输的数据时,以下哪种数据格式最适

合高效ETL操作?

A、CSV

B、JSON

C、Parquet

D、XML

【答案】C

【解析】正确答案是C。Parquet是列式存储格式,支持高效压缩和查询,是AWS

GlueETL作业的推荐格式。A、B、D选项都是行式存储,处理效率较低。知识点:数

据格式选择对ETL性能的影响。易错点:忽略列式存储的优势。

3、SnowballEdge设备上的数据导入AWSGlue前,必须先存储在哪个位置?

A、AmazonRDS

B、AmazonRedshift

C、AmazonS3

D、AmazonDynamoDB

【答案】C

【解析】正确答案是C。AWSGlue主要处理存储在AmazonS3中的数据,Snowball

Edge数据需先上传至S3。其他选项是数据库服务,不是Glue的直接数据源。知识点:

2025年AWS认证SNOWBALLEDGE与AWSGLUE集成专题试卷及解析2

Glue的数据源要求。易错点:混淆数据库与数据湖存储。

4、AWSGlue中的哪个组件负责自动生成ETL代码?

A、Crawlers

B、Jobs

C、Triggers

D、Classifiers

【答案】A

【解析】正确答案是A。Crawlers扫描数据源并生成元数据,自动创建ETL代码框

架。B选项Jobs是执行ETL的作业,C选项Triggers是触发器,D选项Classifiers用

于数据分类。知识点:Glue组件功能。易错点:误以为Jobs直接生成代码。

5、在SnowballEdge与Glue集成场景中,以下哪种情况最适合使用Glue的Spark

运行时?

A、简单数据转换

B、大规模并行处理

C、实时流处理

D、小批量数据

【答案】B

【解析】正确答案是B。Glue的Spark运行时适合大规模并行处理,A、C、D场

景更适合PythonShell或流处理服务。知识点:Glue运行时选择。易错点:忽略Spark

的分布式特性。

6、SnowballEdge设备上的本地数据目录如何与AWSGlueDataCatalog同步?

A、通过AWSCLI手动上传

B、使用GlueCrawlers定期扫描

C、通过Lambda函数实时同步

D、自动同步无需配置

【答案】B

【解析】正确答案是B。GlueCrawlers可以配置扫描S3中的SnowballEdge数据,

自动更新DataCatalog。其他选项要么不可行,要么效率低。知识点:DataCatalog更

新机制。

您可能关注的文档

文档评论(0)

136****2612 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档