模式识别样本量参考解决方案.docxVIP

下载本文档

15
0
约2.65千字
约 5页
2018-05-30 发布于河南
举报
版权申诉

模式识别样本量参考解决方案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模式识别样本量参考解决方案

提纲：第1、2、3、4、5、7、8章所学内容题型：填空题模式识别系统主要由四个部分组成，即：1数据获取2预处理 3特征提取和选择4 分类决策。贝叶斯决策最常用的准则 (1)最小错误率准则 (2)最小风险准则3. 请写出样本x和均值u之间的欧式距离，以及马式距离为开根号名词解释(先英文全拼，后中文解释，6分)：PCA：Principal Component Analysis, 主成分分析. NN：Neural Networks, 神经网络.PR：Pattern Recognition,模式识别根据平方误差准则函数，其最小二乘近似解（MSE解）为估计量的评价标准 1 无偏性 , 2___有效性__3__一致性__。简述题试结合K-L变换简述人脸识别的过程。书223答： 1.从给定样本集中选取训练集，训练集的大小可选，但直接影响识别的正确率。 2.根据生产矩阵E[(x-μ) (x-μ)T]计算出特征脸。为了简化计算，这里用到奇异值分解，其基本原理是通过计算较低矩阵的特征值和特征向量而间接求出较高维矩阵的特征向量（特征脸）。 3.求出训练集中各图像在特征脸空间中的坐标。 4.通过将待识别样本f投影到特征脸子空间求出其系数向量然重建图像最后考虑图像的信噪比，若小于阈值则可判断f不是人脸图像。单层感知器和多层感知器神经网络的主要缺陷分别是什么？BP算法的基本思想是什么，存在哪些不足？书254答：单层感知器缺陷：无法解决异或问题，不具备非线性分类能力。多层感知器缺陷：对于一些识别中需要有可靠的拒绝的情况（如身份确定），多层感知器神经网络无法胜任。BP算法其主要思想：从后向前（反向）逐层传播输出层的误差，以间接算出隐层误差。BP算法缺陷：1.有可能陷入局部极小值点，不能保证收敛到全局极小值点。 2.训练次数多使得学习效率低下，收敛速度慢。 3.隐节点的选取缺乏理论标准。 4.训练时学习新样本有遗忘旧样本的趋势。试写出两类问题的线性判别函数，并说明函数中各个变量的意义。书84答：两类问题的线性判别函数：x是样本向量，即样本在d维特征空间中的描述，w是权向量，分别表示为： w0是一个常数(阈值权)。请简述径向基神经网络和非线性支持向量机的基本思想。ppt prnn5-3-SVM P33答：RBF网络的基本思想： 1.用RBF作为隐单元的“基”构成隐含层空间，将输入矢量直接(即不需要通过权连接)映射到隐空间2. 2.当RBF的中心点确定后，映射关系也就确定 3.隐含层空间到输出空间的映射是线性的非线性支持向量机的基本思想：选择非线性映射Φ(X)将x映射到高维特征空间Z，在Z中构造最优超平面课本上：首先通过非线性变换将输入空间变换到一个高维空间，然后在这个新空间中求取最优线性分类面，而这种非线性变换是通过定义适当的内积函数实现的。请说明BP算法的基本流程ppt 5-2 p77答：(1)初始化； (2)输入训练样本对X=Xp，d=dp计算各层输出； (3)计算网络输出误差； (4)计算各层误差信号； (5)调整各层权值； (6)检查是否对所有样本完成一次轮训； (7)检查网络总误差是否达到精度要求。流程图：见最后监督和非监督模式识别的区别ppt 7 p5答：监督学习方法必须要有训练集和测试样本。在训练集中找规律，而对测试样本使用这种规律；而非监督学习只有一组数据，在该组数据集内寻找规律；监督学习方法的目的是识别事物，给待识别数据加上标号(label)。因此训练样本集必须由带标号的样本组成。而非监督学习方法只有要分析的数据集本身，没有标号。如果发现数据集呈现某种聚集性，则可按自然的聚集性分类，但不以和某种预先的分类标号对上号为目的；和监督模式识别相比，非监督模式识别问题中存在更大的不确定性。计算题医生要根据病人血液中白细胞的浓度来判断病人是否患血液病，根据医学知识和以往的经验，医生知道：患病的人，白细胞的浓度服从均值2000，标准差1000的正态分布；未患病的人，白细胞的浓度服从均值7000，标准差3000的正态分布，一般人群中，患病的人数比例为0.5%。一个人的白细胞浓度是3100，试用Bayes决策方法来判断这个是否患血液病。（10分）ppt prnn2 第51页答：数学表示：用ω表示“类别”这一随机变量，ω1表示患病，ω2表示正常；x表示“白细胞浓度”这个随机变量。本例医生掌握的知识非常充分，包括：1) 类别的先验分布：P(ω1) = 0.5%，P(ω2) = 99.5%先验分布：没有获得观测数据（病人白细胞浓度）之前，已知的关于