DAMA-CDGA(数据治理工程师)-重点章节习题-第14章(大数据和数据科学).pdfVIP

DAMA-CDGA(数据治理工程师)-重点章节习题-第14章(大数据和数据科学).pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据治理工程师CDGA认证考试习题集

第十四章大数据和数据科学(重点章节)

1.数据科学家开展工作依赖于哪些要素()

A.丰富的数据源

B.信息组织和分析

C.展示发现和数据洞察

D.以上全部

2.那些从数据中探究、研发预测模型、机器学习模型、规范性模型和分析方法

并将研发结果进行部署供相关方分析的人,被称为()

A.CDO首席数据官

B.数据分析师

C.数据科学家

D.数据架构师

3.早期,人们通过3V来定义大数据含义的特征,请从下列选项中选择不包含

在3V中的一个选项。()

A.数据量大

B.数据粘度大

1

C.数据更新频繁

D.数据类型多样

4.尝试通过概率估计来预测未来结果的应用程序称为?()

A.维度分析

B.预测分析

C.即时报告

D.描述性分析

5.以下哪种技术已经成为面向数据科学的大数据集分析标准平台。()

A、MPP技术。

B、Hadoop技术。

C、Hbase技术。

D、Redis技术。

6.以下哪一项是提升一个组织大数据和数据科学能力的最大业务驱动力。

()

A、提升业务效率。

B、期望抓住从多种流程生成的数据集中发现的商机。

C、保障数据合规与安全。

D、加强业务管控。

2

7、以下选项中不属于数据挖掘经常使用的技术是()

A.剖析(Profiling)

B.向上卷积(Roll-up)

C.数据缩减(Datareduction)

D.自组织映射(Self-organizingmaps)

8、ETL的作用主要体现在()

A.构建数据集市

B.管理数据仓库

C.把数据转换为信息、知识

D.数据库数据存储

9、关于数据仓库和数据湖的主要差别,以下哪项描述是不正确的()

A.存储数据类型和数据结构化流程不同

B.主要提供的服务不同

C.面向主要用户不同

D.应用侧重点不同

10、定义大数据战略和业务需求,应该考虑提供数据的及时性和范围,许多元

素可以实施提供,也可以定时提供快照,甚至可以整合和汇总,其中流式计算越

来越成为热点,以下不属于流式计算框架的是:()

A.Strom

3

B.Flink

C.Hadoop

D.Spark

11、MapReduce模型有三个主要步骤()

A.剖析、关联、聚类

B.提取、转换、加载

C.映射、修正、转换

D.映射、洗牌、归并

数据治理工程师CDGA认证考试习题答案

第十四章大数据和数据科学(重点章节)

1.正确答案:D

【答案解析】详见书本P388-389页。开发数据科学解决方案,包括将数据源迭

代地整合到开发洞察力的模型中。数据科学依赖于:丰富的数据源、信息组织和

分析、信息交付、展示发现和数据洞察。

2.正确答案:C

【答案解析】详见书本P387-388页。数据科学将数据挖掘、统计分析和机器学

习与数据集成整合,数据建模能力相结合,去构建预测模型、探索数据内容模式。

因为数据分析师或数据科学家会使用一些科学的方法来开发和评估模型,所以开

发预测模型有时被称为数据科学。

3.正确答案:B

【答案解析】详见书本P390页。第3节,大数据,早起,人们通过3V来定义

大数据含义的特征:数据量大(Volume)、数据更新快(Velocity)、数据类型

多样/可变V

文档评论(0)

195****9852 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档