数据挖掘考纲..gzip.docVIP

  • 25
  • 0
  • 约1.1千字
  • 约 3页
  • 2017-08-15 发布于重庆
  • 举报
数据挖掘考纲..gzip.doc

填空: 1、神经元是神经网络的基本组成单元。 2、常见的数据类型有定距数据、定序数据、定类数据及计数数据。 3、K-mean聚类是一种基于划分的聚类方法,在聚类分析中,EM聚类是一种基于模型的聚类算法。 4、在CART算法中,我们采用 Gini指标作为分枝指标。 5、线性回归的因变量必须是连续型的,Logistic 回归的因变量必须是分类型的。 6、在频繁项目集中挑选出所有不被其他元素包含的频繁项目集称为最大频繁项目集。 7、在STATISTICA软件中我们可以通过交叉验证方法寻找最佳聚类数k。 8、决策树的剪枝技术有预剪枝和后剪枝。 9、ARMA模型由两个特殊模型发展而来,一个特例是AR或自回归模型,另一特例是 MA或滑动平均模型。 10、ARMA(p,q)模型中的参数p,q与自相关函数和偏自协相关函数有关。 11、神经网络可分为输入层、隐藏层 、输出层 。 12、基于关联规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。 13、层次聚类分析可以分为两种类型,一种是自下而上的聚合型聚类,另一种是自上而下的拆分型聚类。 14、在ID3算法中,通常用熵来衡量一个内部节点的信息量;而在C4.5算法中,分枝指标采用的是信息增益。 15、BP网络中,信号是正向传播的,而误差是反向传播的。 16、RBF网络的最显著的特点是隐节点的基函数采用距离函数,并使用径向基作为激励函数。 17、

文档评论(0)

1亿VIP精品文档

相关文档