四川大学模式识别期末考试内容.doc

下载文档 降价啦

83
0
约6.08千字
约 18页
2019-06-30 发布于安徽
举报
版权申诉
保障服务

四川大学模式识别期末考试内容.doc

1、本文档共18页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

. . . .......... 一．计算题在图像识别中，假定有灌木和坦克2种类型，它们的先验概率分别是0.7和0.3，损失函数如下表所示。其中，类型w1和w2分别表示灌木和坦克，判决a1=w1，a2=w2。现在做了2次实验，获得2个样本的类概率密度如下：状态损失决策 W1 W2 a1 0.5 2 a2 4 1.0 （1）试用最小错误率贝叶斯准则判决2个样本各属于哪一类？坦克、灌木。（2）试用最小风险决策规则判决2个样本各属于哪一类？灌木、灌木。答：（1）最小错误率贝叶斯准则（2）最小风险决策规则给出二维样本数据(-1,1),(2,2),(1,-1),(-2,-2)，试用K-L变换作一维数据压缩。答：数据压缩结果：0，，0，已知两类的数据：ω1：(1,0),(2,0),(1,1)；ω2：(-1,0),(0,1),(-1,1)，试求该组数据的类内与类间散布矩阵。其中Sw为类内，Sb为类间 4、已知欧氏二维空间中两类9个训练样本w1:(-1,0)T,(-2,0)T,(-2,1)T,(-2,-1)T w2:(1,1)T,(2,0)T,(1,-1)T,(2,1)T,(2,2)T，试分别用最近邻法和K近邻法求测试样本(0,0)T的分类，取K=5，7。答：最近邻法：最近邻为(-1，0)T分类为w1 K近邻法： K=5：5个近邻为1类的(-1,0)T,(-2,0)T，2类的(1,1)T,(2,0)T,(1,-1)T 分类为w2 K=7：1）若近邻为1类的(-1,0)T,(-2,0)T,(-2,1)T,(-2,-1)T，2类的(1,1)T,(2,0)T,(1,-1)T，则分类为w1 2）若近邻为1类的(-1,0)T,(-2,0)T,(-2,1)T或(-2,-1)T两个之一，2类的(1,1)T,(2,0)T,(1,-1)T,(2,1)T，则分类为w2 5. 已知两类的训练样本：w1(0,0)T,(0,2)T;w2(2,0)T,(2,2)T，试用最小平方误差准则算法进行分类器训练，求解向量w*。简答题简答题什么是模式与模式识别？模式：对象之间存在的规律性关系；模式识别：是研究用计算机来实现人类模式识别能力的一门学科。 /*模式：广义地说，模式是一些供模仿用的、完美无缺的标本。本课程把所见到的具体事物称为模式，而将它们归属的类别称为模式类。模式的直观特性:可观察性，可区分性，相似性模式识别：指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程。*/ 一个典型的模式识别系统主要由哪几个部分组成什么是后验概率？系统在某个具体的模式样本X条件下位于某种类型的概率。确定线性分类器的主要步骤 ①采集训练样本，构成训练样本集。样本应该具有典型性 ②确定一个准则J=J(w,x)，能反映分类器性能，且存在权值w*使得分类器性能最优 ③设计求解w的最优算法，得到解向量w* 样本集推断总体概率分布的方法近邻法的基本思想是什么？作为一种分段线性判别函数的极端情况，将各类中全部样本都作为代表点，这样的决策方法就是近邻法的基本思想。什么是K近邻法？取未知样本x的k个近邻，看这k个近邻中多数属于哪一类，就把x归为哪一类。监督学习与非监督学习的区别利用已经标定类别的样本集进行分类器设计的方法称为监督学习。很多情况下无法预先知道样本的类别，从没有标记的样本集开始进行分类器设计，这就是非监督学习。 /*监督学习：对数据实现分类，分类规则通过训练获得。该训练集由带分类号的数据集组成，因此监督学习方法的训练过程是离线的。非监督学习方法不需要单独的离线训练过程，也没有带分类号的训练数据集，一般用来对数据集进行分析。如聚类，确定其分布的主分量等。*/ 什么是误差平方和准则？对于一个给定的聚类，均值向量是最能代表聚类中所有样本的一个向量，也称其为聚类中心。一个好的聚类方法应能使集合中的所有向量与这个均值向量的误差的长度平方和最小。分级聚类算法的2种基本途径是什么按事物的相似性，或内在联系组织起来，组成有层次的结构，使得本质上最接近的划为一类，然后把相近的类再合并，依次类推，这就是分级聚类算法的基本思想。聚合法：把所有样本各自看为一类，逐级聚合成一类。基本思路是根据类间相似性大小逐级聚合，每级只把相似性最大的两类聚合成一类，最终把所有样本聚合为一类。分解法：把所有样本看做一类，逐级分解为每个样本一类。特征抽取与特征选择的区别？特征抽取：原始特征的数量可能很大，或者