数据挖掘-分类分析.ppt

* 基于神经网络的分类方法 缺点: 需要很长的训练时间,因而对于有足够长训练时间的应用更合适。 需要大量的参数,这些通常主要靠经验确定,如网络拓扑。 可解释性差。该特点使得神经网络在数据挖掘的初期并不看好。 * 基于神经网络的分类方法 优点: 分类的准确度高 并行分布处理能力强 分布存储及学习能力高 对噪音数据有很强的鲁棒性和容错能力 最流行的基于神经网络的分类算法是80年代提出的后向传播算法。 * 后向传播算法 后向传播算法在多路前馈神经网络上学习。 * 定义网络拓扑 在开始训练之前,用户必须说明输入层的单元数、隐藏层数(如果多于一层)、每一隐藏层的单元数和输出层的单元数,以确定网络拓扑。 * 定义网络拓扑 对训练样本中每个属性的值进行规格化将有助于加快学习过程。通常,对输入值规格化,使得它们落入0.0和1.0之间。 离散值属性可以重新编码,使得每个域值一个输入单元。例如,如果属性A的定义域为(a0 ,a1 ,a2),则可以分配三个输入单元表示A。即,我们可以用I0 ,I1 ,I2作为输入单元。每个单元初始化为0。如果A = a0,则I0置为1;如果A = a1,I1置1;如此下去。 一个输出单元可以用来表示两个类(值1代表一个类,而值0代表另一个)。如果多于两个类,则每个类使用一个输出单元。 * 定义网络拓扑 隐藏层单元数设多少个“最好” ,没有明确的规

文档评论(0)

1亿VIP精品文档

相关文档