数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案期末考试题.pdfVIP

  • 16
  • 0
  • 约3.48千字
  • 约 13页
  • 2024-01-02 发布于中国
  • 举报

数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案期末考试题.pdf

数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案

期末考试题库2023

1.数据挖掘又称从数据中发现知识,后者英文简称为()。

答案:

KDD

2.数据挖掘又称从数据中发现知识,前者英文简称为()。

答案:

DM

3.一般数据挖掘的流程顺序,下列正确的是()。

①选择数据挖掘的技术、功能和合适的算法

②选择数据,数据清洗和预处理

③了解应用领域,了解相关的知识和应用目标

④寻找感兴趣的模式、模式评估、知识表示

⑤创建目标数据集

答案:

③⑤②①④

4.结构化的数据是指一些数据通过统一的()的形式存储的,这类数据我们

称为结构化的数据。

答案:

二维表格

5.数值预测用于连续变量的取值,常用的预测方法是()。

答案:

回归分析

6.以下Python包中,绘图功能最强大的是()。

答案:

matplotlib

7.以下Python包中,最适合用于机器学习的是()。

答案:

scikit-learn

8.以下Python包中,提供了DataFrame数据类型的是()。

答案:

pandas

9.下列关于数据规范化说法错误的是()。

答案:

数据规范化是为了给重要的属性赋予更大的权重

10.使用python处理缺失值的方法中叙述错误的是()。

答案:

interpolate()使用中位数填充缺失值

11.主成分分析方法PCA属于属于python中的哪个包()。

答案:

sklearn

12.在numpy包中,计算中位数的函数为()。

答案:

numpy.median()

13.运行以下代码“import引入plt后,要绘制直方图,

需要利用的函数为()。

答案:

plt.hist()

14.使用最小-最大法进行数据规范化,需要映射的目标区间为[0,100],原来的

取值范围是[-10,10]。根据等比映射的原理,一个值8映射到新区间后的值

是()。

答案:

90

15.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第一

个参数是()。

答:

样本特征X

16.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第二

个参数是()。

答:

样本标签Y

17.在Scikit-learn模块下,不同分类模型在预测时,调用的方法名称是否相同

()。

答:

相同

18.通过代码

from

引入线性模型模块,并通过代码

reg

构造回归器对象后,在训练时要调用的方法是()

答案:

reg.fit()

19.利用linear_model.LinearRegression()训练模型时调用.fit()方法需要传递的

第二个参数是()。

答案:

样本标签Y

20.通过代码

from

引入KMeans模块,生成模型对象

kmeans

后,对于数据X训练时可以用以下哪行代码?()

答案:

kmeans.fit(X)

21.通过代码

from

引入Kmenas模块后,生成模型对象

kmeans

并完成对数据X完成聚类后,以下哪个代码可以查看每个样本所属簇的

签()

答案:

kmeans.labels_

22.数据挖掘包括下面哪些方法()。

答案:

聚类

分类

关联

异常发现

23.数据挖掘和哪些学科领域有关系()。

答案:

机器学习

优化

数据库

统计

24.下列对学生的描述

文档评论(0)

1亿VIP精品文档

相关文档