- 16
- 0
- 约3.48千字
- 约 13页
- 2024-01-02 发布于中国
- 举报
数据挖掘与python实践_中央财经大学中国大学mooc课后章节答案
期末考试题库2023
1.数据挖掘又称从数据中发现知识,后者英文简称为()。
答案:
KDD
2.数据挖掘又称从数据中发现知识,前者英文简称为()。
答案:
DM
3.一般数据挖掘的流程顺序,下列正确的是()。
①选择数据挖掘的技术、功能和合适的算法
②选择数据,数据清洗和预处理
③了解应用领域,了解相关的知识和应用目标
④寻找感兴趣的模式、模式评估、知识表示
⑤创建目标数据集
答案:
③⑤②①④
4.结构化的数据是指一些数据通过统一的()的形式存储的,这类数据我们
称为结构化的数据。
答案:
二维表格
5.数值预测用于连续变量的取值,常用的预测方法是()。
答案:
回归分析
6.以下Python包中,绘图功能最强大的是()。
答案:
matplotlib
7.以下Python包中,最适合用于机器学习的是()。
答案:
scikit-learn
8.以下Python包中,提供了DataFrame数据类型的是()。
答案:
pandas
9.下列关于数据规范化说法错误的是()。
答案:
数据规范化是为了给重要的属性赋予更大的权重
10.使用python处理缺失值的方法中叙述错误的是()。
答案:
interpolate()使用中位数填充缺失值
11.主成分分析方法PCA属于属于python中的哪个包()。
答案:
sklearn
12.在numpy包中,计算中位数的函数为()。
答案:
numpy.median()
13.运行以下代码“import引入plt后,要绘制直方图,
需要利用的函数为()。
答案:
plt.hist()
14.使用最小-最大法进行数据规范化,需要映射的目标区间为[0,100],原来的
取值范围是[-10,10]。根据等比映射的原理,一个值8映射到新区间后的值
是()。
答案:
90
15.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第一
个参数是()。
答:
样本特征X
16.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第二
个参数是()。
答:
样本标签Y
17.在Scikit-learn模块下,不同分类模型在预测时,调用的方法名称是否相同
()。
答:
相同
18.通过代码
from
引入线性模型模块,并通过代码
reg
构造回归器对象后,在训练时要调用的方法是()
答案:
reg.fit()
19.利用linear_model.LinearRegression()训练模型时调用.fit()方法需要传递的
第二个参数是()。
答案:
样本标签Y
20.通过代码
from
引入KMeans模块,生成模型对象
kmeans
后,对于数据X训练时可以用以下哪行代码?()
答案:
kmeans.fit(X)
21.通过代码
from
引入Kmenas模块后,生成模型对象
kmeans
并完成对数据X完成聚类后,以下哪个代码可以查看每个样本所属簇的
签()
答案:
kmeans.labels_
22.数据挖掘包括下面哪些方法()。
答案:
聚类
分类
关联
异常发现
23.数据挖掘和哪些学科领域有关系()。
答案:
机器学习
优化
数据库
统计
24.下列对学生的描述
原创力文档

文档评论(0)