学 号 姓 名
学 号 姓 名 学 院
……………………密……………封……………线……………以……………内……………答……………题……………无……………效……………………
(考试时间: 至 ,共 2 小时)
课程名称 模式识别 教师 学时 40 学分 2
教学方式 课堂教学 考核日期 年 月 日 成绩
考核方式: (学生填写)
1、(5分)简述有监督学习和无监督学习的异同。
答:
(1)有监督学习必须要有训练集和测试样本,而非监督学习没有训练集;
(2)有监督学习的目的就是识别事物,识别结果表现在给待识别数据加上了标号,因此训练样本集必须由带标号的样本组成,而非监督学习方法只有要分析的数据集本身,预先没有什么标号。
(3)非监督学习方法在寻找数据集中的规律性,这种规律性并不一定要达到分数据集的目的,也就是说不一定要“分类”。
2、(15分)计算单词model和amdeol的编辑距离,画出栅格图。
解:
栅格图为:
从栅格图可计算,model和amdeol的编辑距离为3。
3、(15分)已知A类样本为:,B类样本为:,计算最小二乘分类面的方程(取值为-1和+1),并写出LMS算法的流程。
解:
(1)计算最小二乘分类面为。
(2)LMS算法流程:
步骤1. 初始化训练样本、权向量;
步骤2. 选择一个训练样本,利用下列公式更新权向量:
步骤3. 重复所有样本。
4、(15分)在目标识别中,有和两种目标类型,它们的先验概率分别为0.8和0.2,在一次试验中,获得样本的类概率密度分别为,,并且已知,,,。试对该样本进行分类。
(1)基于最小错误率贝叶斯决策;
(2)基于最小风险贝叶斯决策。
解:(1)利用贝叶斯公式,分别计算出和的后验概率:
根据贝叶斯决策规则,有
所以合理的决策是把该样本归类于。
(2)根据(1)的计算结果可知后验概率为
计算条件风险
由于,因此判断该样本为。
5、(15分)试描述监督分类三种准则的原理及典型方法。
答:
回归分析,利用函数逼近的观点构造判决函数,典型方法包括:LMS、RBF网络等。
支持向量机,从几何角度,构造约束最优化模型,寻找最优分类面,典型方法包括:线性支持向量机和非线性支持向量机。
神经网络,从仿生学角度构造神经网络结构,通过最优化方法进行网络训练,典型方法包括:感知器模型,BP网络等。
6、(20分)已知四个样本具有三个特征,分别为:
1)计算其协方差矩阵,并对其进行主分量,并对结果进行分析。
2)简述mercer定理及核主分量分析的原理。
解:
(1)协方差矩阵:
其中,。
求协方差矩阵的特征值为,,,两个主分量为和对应的特征向量,分别为:
说明三个特征分量中有一个特征和另外两个特征相关,采用主分量分析可以识别该相关向量,达到降低特征空间维度的目的。
(2)Mercer定理认为,映射变换后的内积可以写为函数的形式。
定义:
则有:
根据mercer定理,
最后得到:
相当于在投影域计算KL变换,并进行PCA。
7、(15分)请写出模式识别系统的主要系统组成,阐述各部分的功能及主要方法。
答:模式识别系统的主要系统组成如下:
识别样本,采集用于采集待识别问题的数据
数据预处理,主要消除采集系统差异对识别的影响
特征提取与选择,从数据中提取具特征,并进行去相关等处理
分类器,进行分类,包括监督分类和非监督分类两种,列举相关方法。
原创力文档

文档评论(0)