ACP大数据工程题库.docx

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

[单选题]

1.ADS创建表组时,可以指定表组的副本数,关于副本数的说法,以下哪项是正确的?()

A.表组的副本数越多,可以一定程度的增加ADS的最大承受的QPS

B.表组的副本数为1时,写入数据会最快,相比副本较多的情况,在数据导入时不可用时间会更短

C.表组的副本数最小值为2

D.表组的副本数越少,表组的可用性会越高

答案:A

解析:minRedundancy表示该表组的副本数,默认为2,可配置为1、2、4、8。需要注意的是,如果将一个表组配置为1副本,那么这个表组中的表在数据导入时会有不可用的时间。而将表组副本数配置为4或更高,可以一定程度的增加分析型数据库的最大承受的QPS,但是数据存储费用也会相应增加。executeTimeout表示该表组的全局Query超时时间,默认为30000,单位毫秒。

2.作为技术人员,小王被ODPS强大的数据处理能力吸引,想去体验一下。他快速注册了一个阿里云帐号,进入官网后试图创建一个名字为test_project的ODPSproject,结果没有成功。分析,小王出错的最有可能的原因是哪一个?

A.帐号未充值,余额不足导致出错

B.帐号未开通ODPS的使用权限

C.未创建合适的accessID和accessKey

D.项目名字和现有的其他帐户的名字重复

答案:D

3.资源(Resource)是大数据计算服务(MaxCompute,原ODPS)的特有概念。用户如果想使用MaxCompute的MapReduce或自定义函数(UDF)功能,需要依赖资源来完成。DataIDE中,可以通过数据开发面板的资源管理上传资源,目前支持的资源类型有?

A.jar、file、archive

B.jar、file、python

C.jar、archive、python

D.file、archive、python

答案:A

解析:支持File类型、Table类型、Jar类型和Archive类型

4.针对ODPSSQL做逻辑分析的时候,会进行一些优化,不包括以下哪种优化()

A.扫描方式

B.列映射

C.谓语动词下沉

D.常量表达式

答案:A

5.在数据仓库中,随着表数量越来越多,对于表的管理会越来越复杂,希望可以按一定的规则划分类目,将不同的表归到不同类目中去,方便管理,即在业务层面上定义类目,对表进行类目划分,以下关于表类目说法正确的是?

A.DataIDE的组织管理模块实现了类目管理

B.可以通过DataIDE的项目管理模块实现

C.大数据计算服务(MaxCompute,原ODPS)中提供了类目管理功能

D.DataIDE的数据管理模块实现了类目管理

答案:D

解析:DataWorks数据地图模块,取代数据管理模块,数据地图具备元数据采集和类目管理功能

6.在使用DataIDE进行数据同步时,会因为数据质量问题,导致部分记录无法从源表同步至目标表中去。数据同步任务Task1的目标表为云数据库RDS中的表,假设数据同步过程中只会因主键冲突产生错误纪录。以下关于主键冲突配置中说法正确的是()

A.当主键冲突配置为“视为脏数据,保留原有数据(insertinto)”,则后导入的数据被丢弃,并被视作脏数据

B.当主键冲突配置为“替换原有数据(replaceinto)”时,会使用新数据直接替换原有纪录,并计入脏数据纪录

C.无需配置主键冲突处理规则,所有的主键冲突都不会被视为脏数据

D.无需配置主键冲突处理规则,所有的主键冲突都会被自动视为脏数据

答案:A

解析:eplaceinto…:没有遇到主键/唯一性索引冲突时,与insertinto行为一致,冲突时会用新行替换原有行所有字段。insertinto…:当主键或唯一性索引冲突时会写不进去冲突的行,以脏数据的形式体现。

7.在实际应用中,哪种性能指标表示RDS实例磁盘空间的使用量?

A.磁盘空间

B.CPU利用率

C.IOPS

D.连接数

答案:A

解析:无

8.在利用RDS管理控制台将数据迁移至RDS-MySQL中的时候,使用的方法是MySQL在线迁移,可以不停服务就能够完成数据库的迁移工作,以下哪个MySQL版本不支持在线迁移?

A.MySQL5.6

B.MySQL5.1

C.MySQL5.0

D.MySQL5.5

答案:C

解析:MySQL数据库版本为5.1、5.5、5.6、5.7或8.0版本

9.在大数据计算服务的数据仓库中的订单表fact_order,建表语句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的数据是从ods_order加工而来,ods_order建表语句如下:c

文档评论(0)

同甫 + 关注
实名认证
内容提供者

顺不妄喜,逆不惶馁。

1亿VIP精品文档

相关文档