8-模式识别与机器学习思考题.docVIP

  • 62
  • 0
  • 约7.36千字
  • 约 12页
  • 2017-02-01 发布于重庆
  • 举报
8-模式识别与机器学习思考题

模式识别与机器学习 思考题 1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。 试题1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。 答:(1)模式识别是研究用计算机来实现人类的模式识别能力的一门学科,是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。主要集中在两方面一是研究生物体是如何感知的二是在给定的任务下如何用计算机实现识别的理论和方法。在数据挖掘的各种方法中 ,决策树归纳学习算法以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和较高的分类准确率等优点而得到广泛比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦对决策树常见的批评是说其在为一个节点选择怎样进行分割时使用“贪心”算法。此种算法在决定当前这个分割时根本不考虑此次选择会对将来的分割造成什么样的影响。BP神经网络算法 其学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理后,传至输出层。如果输出层得不到期望输出,那么就转为反向传播,把误差信号沿连接路径返回,并通过修改各层神经元的权值,使误差信号最小。 优缺点:BP算法能够通过学习带正确答案的实例集自动提取“合理的”求解规则;具有一定的推广能力;学习过程有被“固化”的潜在可能性;它能以任意精度逼近任意非线性函数,而且具有良好的逼近性能,并且结构简单,是一种性能优良的神经网络。但也存在一些问题,BP算法是按照均方误差的梯度下降方向收敛的,但均方误差的梯度曲线存在不少局部和全局最小点,这就使得神经网络易陷入局部最小;算法的收敛速度较慢,可能会浪费大量时间;神经网络隐层的结点个数难以确定合适的数值;如何选取合适的学习样本解决网络的推广(泛化)问题,即使网络能正确处理未学习过的输入。 (8)Hopfield网络算法 Hopfield网络算法作为典型的反馈神经网络,有下列特有的优点和缺点。 1. 只有不动点吸引子,没有其它类型的吸引子。Hopfield同的这个性质被称为全局稳定性。2. 网络状态的演化趋于某个二次函数的局部最小点。3. 很难精确地分析Hopfield网的性能。4. 难于找到通用的学习算法。5. 这类阿络的动力学行为过于筒单。5. Hopfield问只有不动点吸子,是一种消极被动的神经网络。 3:试举例说明,如何将一个实际问题化解成所学的机器学习算法来解决的问题。 例如:根据下列的数据集,你如何利用机器学习的算法,设计一个从程序,当输入三个数值作为Age, Tall,Weight时,马上就能给出答案,这应该是何种动物? 试题3:简述在模式识别与机器学习中解决问题的主要步骤。指出那些步骤涉及到学习?在数据的前处理中,特征选择起什么作用? (Sheep,Ox,或 Pig)。 *Age Tall Weight Animal 0 30 8 sheep 1 35 10 sheep 2 37 16 sheep 3 40 20 sheep 4 45 25 sheep 5 50 35 sheep 6 55 40 sheep 7 60 45 sheep 8 65 50 sheep 9 65 50 sheep 10 65 50 sheep 0 45 15 ox 1 50 25 ox 2 55 35 ox 3 65 45 ox 4 70 55 ox 5 75 65 ox 6 80 75 ox 7 85 85 ox 8 90 95 ox 9 95 105 ox 10 105 115 ox 0 15 5 pig 1 17 15 pig 2 20 25 pig 3 23 35 pig 4 27 45 pig 5 30 55 pig 6 33 65 pig 7 35 75 pig 8 37 85 pig 9 40 95 pig 10 45 105 pig 答: (1) 在模式识别与机器学习中解决问题的主要步骤: 1. 问题描述:准确分析研究目的,并对未来工作做出计划。 2. 数据选择:数据选择是根据用户需求从数据库中提取相关数据。 3. 知识发现过程: 归纳为3个步骤,即数据挖掘预处理、数据挖掘、数据挖掘后处理。数据预处理是对数据进行再加工,检查数据的完整性及一致性,对其中的噪 音数据进行处理。对丢失的数据利用统计方法进行填补,形成发掘数据库。数据变换即从发掘数据库里选择数据,变换的方法主要是利用聚类分析和判别分析。数据挖掘是根据用户要求,确定知识发现的目标是发现何种类型的知识。运用选定的知识发现算法。从数据库中提取用户所需要的知识。知识评价主要用于对所获得的规则进行价值评定,以决定所得到的规则是否存入基础知识库。 4. 选择或设计模型:对同一个问题或许有许多不同的模

文档评论(0)

1亿VIP精品文档

相关文档