数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案期末考试题.pdfVIP

下载本文档

16
0
约3.48千字
约 13页
2024-01-02 发布于中国
举报

数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案期末考试题.pdf

数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案

期末考试题库2023

1.数据挖掘又称从数据中发现知识，后者英文简称为（）。

答案:

KDD

2.数据挖掘又称从数据中发现知识，前者英文简称为（）。

答案:

3.一般数据挖掘的流程顺序，下列正确的是（）。

①选择数据挖掘的技术、功能和合适的算法

②选择数据，数据清洗和预处理

③了解应用领域，了解相关的知识和应用目标

④寻找感兴趣的模式、模式评估、知识表示

⑤创建目标数据集

答案:

③⑤②①④

4.结构化的数据是指一些数据通过统一的（）的形式存储的，这类数据我们

称为结构化的数据。

答案:

二维表格

5.数值预测用于连续变量的取值，常用的预测方法是（）。

答案:

回归分析

6.以下Python包中，绘图功能最强大的是（）。

答案:

matplotlib

7.以下Python包中，最适合用于机器学习的是（）。

答案:

scikit-learn

8.以下Python包中，提供了DataFrame数据类型的是（）。

答案:

pandas

9.下列关于数据规范化说法错误的是（）。

答案:

数据规范化是为了给重要的属性赋予更大的权重

10.使用python处理缺失值的方法中叙述错误的是（）。

答案:

interpolate()使用中位数填充缺失值

11.主成分分析方法PCA属于属于python中的哪个包（）。

答案:

sklearn

12.在numpy包中，计算中位数的函数为（）。

答案:

numpy.median()

13.运行以下代码“import引入plt后，要绘制直方图，

需要利用的函数为（）。

答案:

plt.hist()

14.使用最小-最大法进行数据规范化，需要映射的目标区间为[0,100]，原来的

取值范围是[-10,10]。根据等比映射的原理，一个值8映射到新区间后的值

是（）。

答案:

15.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第一

个参数是（）。

答:

样本特征X

16.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第二

个参数是（）。

答:

样本标签Y

17.在Scikit-learn模块下，不同分类模型在预测时，调用的方法名称是否相同

（）。

答:

相同

18.通过代码

from

引入线性模型模块，并通过代码

reg

构造回归器对象后，在训练时要调用的方法是（）

答案:

reg.fit()

19.利用linear_model.LinearRegression()训练模型时调用.fit()方法需要传递的

第二个参数是（）。

答案:

样本标签Y

20.通过代码

from

引入KMeans模块，生成模型对象

kmeans

后，对于数据X训练时可以用以下哪行代码？（）

答案:

kmeans.fit(X)

21.通过代码

from

引入Kmenas模块后，生成模型对象

kmeans

并完成对数据X完成聚类后，以下哪个代码可以查看每个样本所属簇的

签（）

答案:

kmeans.labels_

22.数据挖掘包括下面哪些方法（）。

答案:

聚类

分类

关联

异常发现

23.数据挖掘和哪些学科领域有关系（）。

答案:

机器学习

优化

数据库

统计

24.下列对学生的描述

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案期末考试题.pdfVIP