数据仓库与数据挖掘_北京理工大学中国大学mooc课后章节答案期末考试题.pdf

数据仓库与数据挖掘_北京理工大学中国大学mooc课后章节答案期末考试题.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据仓库与数据挖掘_北京理工大学中国大学mooc课后章节答案期末

考试题库2023年

1.假设属性income的最大最小值分别是12000元和98000元。利用最大最

小规范化的方法将属性的值映射到0至1的范围内。对属性income的

73600元将被转化为:()

参考答案:

0.716

2.数据的可视化是将数据以各种图表的形式展现在用户的面前,使用户能观察

数据,并在较高的层次上找出数据间可能的关系。

参考答案:

正确

3.数据挖掘和可视化都是知识提取的方式。

参考答案:

正确

4.面向应用场景的可视化交互式数据挖掘方法是以数据挖掘算法和模型为主,

并不针对具体应用场景或数据类型

参考答案:

错误

5.将原始数据进行集成、变换、维度规约、数值规约是以下哪个步骤的任务?

()

参考答案:

数据预处理

6.数据仓库的数据ETL过程中,ETL软件的主要功能包括()

参考答案:

数据抽取_数据加载_数据转换

7.数据挖掘的主要任务是从数据中发现潜在规则,从而能更好的完成描述数据、

预测数据的任务。

参考答案:

正确

8.传统数据仓库包括数据仓库数据库、数据抽取/转换/加载、元数据、访问工

具、数据集市、和信息发布系统七个部分组成。

参考答案:

数据仓库管理

9.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

参考答案:

错误

10.假定你现在训练了一个线性SVM并推断出这个模型出现了欠拟合现象。在

下一次训练时,应该采取下列什么措施?()

参考答案:

增加特征

11.下面哪一项关于CART的说法是错误的()

参考答案:

CART输出变量只能是离散型。

12.以下哪种方法不是常用的数据约减方法()

参考答案:

关联规则挖掘

13.假设12个销售价格记录组已经排序如下:5,

204,使用如下每种方法将它们划分成四个箱。等频(等深)划分时,

15在第几个箱子内?

参考答案:

第二个

14.下表是一个购物篮,假定支持度阈值为40%,其中()是频繁闭项集。TID

项1abc2abcd3bce4acde5de

参考答案:

abc_de

15.利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在

以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要

剪枝的是()ID购买项1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、

尿布、啤酒、可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可乐

参考答案:

啤酒、面包_啤酒、牛奶

16.一个数据集的分布的五数概括由最小值、第一个四分位数、______、第三个

四分位数、和最大值构成。

参考答案:

中位数

17.以下哪项关于决策树的说法是错误的

参考答案:

决策树算法对于噪声的干扰非常敏感

18.数据仓库的生命周期包括_规划分析阶段_、_设计实施阶段_、三个阶段。

参考答案:

使用维护阶段

19.DBSCAN中密度相连关系满足对称性

参考答案:

正确

20.业内主流的数据仓库方法论主要有两种:Kimball和

参考答案:

Inmon

21.数据仓库的数据模型分为概念模型、逻辑模型、三个层次

参考答案:

物理模型

22.数据转换的常用规则有:字段级转换、、多源数据整合和集合和汇总。

参考答案:

清洁和净化

23.元数据的分类标准有:、应用场合、具体内容和具体用途。

参考答案:

领域相关性

24.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,

但是检验误差开始增大,这是出现了模型拟合不足的问题。

参考答案:

错误

25.KNN算法是一种典型的消极学习器。

参考答案:

正确

26.FP表示被错误地划分为负例的个数,即实际为正例但被分类器划

您可能关注的文档

文档评论(0)

151****5730 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档