大数据工程技术人员初级——理论第2套.pdfVIP

下载本文档

0
0
约1.75万字
约 23页
2024-12-31 发布于河南
举报
版权申诉

大数据工程技术人员初级——理论第2套.pdf

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博观而约取，厚积而薄发。——苏轼

大数据工程技术人员初级——理论第2套

（√）1.运用基于计算机的方法，包括新技术，从而在数据中获得有用知识的整个

过程，就叫做数据挖掘。

（√）2.大数据往往可能蕴含着丰富的规律和知识，所以在大数据之上应用数据挖

掘就成了理所当然的活动了。

（√）3.1989年，术语“数据库中的知识发现”正式确立，即KDD。

（√）4.通过数据挖掘技术，可以发现许多深层的、手工无法发现的规律，帮助企

业在激烈的竞争环境中，占有更多的先机。

（√）5.一般而言，数据仓库应先行建立完成，数据发掘才能有效率的进行。

（×）6.Web数据挖掘是通过数据库中的一些属性来预测另一个属性，它在验证用

户提出的假设过程中提取信息。

（×）7.与分类不同的是，回归的输出是离散的类别值，而分类的输出是连续数

值。

（√）8.近年来，随着人工智能机器学习模式识别和数据挖掘等领域中传统方法的

不断发展以及各种新方法新技术的不断涌现，分类方法得到了长足的发展。

（×）9.“根据客户的消费行为，把客户分成三个类，第一个类的主要特征

是……”，实际上这是一个分类问题。

（×）10.至今Apriori仍然作为聚类分析的经典算法被广泛讨论。

（√）11.神经网络在学习中,一般分为“有教师学习”和“无教师学习”两种。

（√）12.早期的数据挖掘工具采用命令行界面，而且文本格式的输出也不够直

观。

（×）13.k-Means聚类算法以相对距离作为相似度测度，它是求对应某一初始聚

类中心向量V最优分类，使得评价指标J最小。

（√）14.从混淆矩阵中，可以衍生出各种评价的指标。错误发现率（False

discoveryrate，FDR），表示在模型预测为正类的样本中，真正的负类的样本所占

的比例。

（√）15.层次聚类方法的基本思想是：通过某种相似性测度计算节点之间的相似

性，并按相似度由高到低排序，逐步重新连接个节点。

（×）16.政府2.0、政府3.0，与政府以后的治理改革和服务型政府建设的目标是

完全不一致的。

（×）17.深度学习就是指Tensorflow框架。

（√）18.大数据的价值重在挖掘，目的在于从数据中获取有用知识。

（×）19.简单随机抽样，是从总体N个对象中任意抽取n个对象作为样本，最终

以这些样本作为调查对象。在抽取样本时，总体中每个对象被抽中为调查样本的概

率可能会有差异。

（√）20.维是人们观察数据的特定角度，是考虑问题时的一类属性。

单项选择题

博观而约取，厚积而薄发。——苏轼

1.下列哪个选项不属于数据可视化的范畴（）。[单选题]*

A.科学可视化

B.图表可视化(正确答案)

C.信息可视化

D.可视化分析

2.下列哪个选项不属于最为常见的六种图形（）。[单选题]*

A.饼图

B.条形图

C.树图(正确答案)

D.柱状图

3.下列（）可视化图表通常用颜色深浅表示数值大小[单选题]*

A.柱状图

B.热力图(正确答案)

C.散点图

D.气泡图

4.数据集合中出现次数最多的数值被称为（）[单选题]*

A.平均数

B.众数(正确答案)

C.中位数

D.极差

5.（）指总体中的最大值与最小值的差，反映总体标志值的差异范围。[单选题]*

您可能关注的文档

文档评论（0）

186****6869 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

大数据工程技术人员初级——理论第2套.pdfVIP