模式識别基础复习资料.docxVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式識别基础复习资料

?卷一、模式识别机经?????????????????????????? 1.(16分)正态分布N(0,9)与均匀分布[5,10],先验概率1/2最小错误率分类器,并画图.最小错误率分类器缺点答:1.设计最小错误率分类器:如果则为反之则为(特别的,当,可以接受为任何一类也可以拒绝。在连续情况下这种情况几乎完全不出现。,2.画图如下,红色表示([5,10]均匀分布的后验概率),蓝色表示(N(0,9)的后验概率)(注意!!!图是错的——作者)(图是错的)3.最小错误分类器有许多局限性。其一,其只考虑到错误率的限制,并未考虑到实际情况中不同错误的代价等等,为了克服这类局限性,学者们在最小错误率之外又设计了最小风险分类器、限定一类错误率令另一类错误率最小的分类器等;其二,其只能用于监督学习,要求已知分类情况,并且要满足I.I.D条件即样本与总体分布相符;其三,其要求必须知道先验概率,许多实际问题的先验概率是难以得到的。2.(22分)8个样品w1?3个...,w2?5个.....1)最近邻分类,画图2)给两个点..,问怎么分3)最近邻分类器线性分类器?4)设计二次曲面分之5)压缩近邻法压缩过程及结果6)压缩近邻法分界面并比较1)答:(题目不完整)最近邻法(k=1),k近邻(k个最近的点投票),可以考虑加权3.(5分)证明两个样品构成得协方差矩阵一般是奇异的(不可逆的)答:设,从而其第i行j列元素为,表示第m个样本第n个维度的值。从而这是一个行列式为零的矩阵(第一行除以(),第二行除以之后想减得零,故该协方差阵是奇异的。4.(26分)距离不同会有不同结果1)给出两种你认为重要的距离,如何定义及物理意义2)贝叶斯分类器,近邻法,fisher投影法,c均值法是否受距离度量影响,不受则说明理由,受,距离说明答:距离可以是任意一种范数,设对点欧几里得距离(2范数):每个坐标的绝对值差之和(1范数):贝叶斯分类器不受、fisher投影法不受:都属于判别函数与距离度量无关的,故不受影响,近邻法,c均值法与受到距离度量的5.(15分)AB玩游戏,A问是非问题,B回答是或非.问1)游戏与模式识别什么内容有关系?用模式识别语言描述2)B应如何调整问题3)如果做成计算机游戏,写出设计思路,方法,难点,解决方案.游戏受欢迎吗?为什么?答:???这是一类决策树问题。可以将每一个是非问题看做一个决策树节点,是非答案决定了分支的方向(左或右)。调整问题应该使得在有效分类的情况下树深度最浅,就能在单次游戏最坏情况下最快猜出。(我觉得挺2的,应该不会受欢迎。。不过可以用作公安局犯罪嫌疑人指认的软件)6.(6分)自己设计模糊数学用于模式识别的其他理论方法(除去聚类).写出思路必要细节.分析可能结果.答:例如k-近邻法的模糊性质。定义隶属函数表示属于类的程度,值域上界为1,表示完全属于,下界为0,表示完全不属于,将对任意一个待判定的样本,选取某个距离度量(如欧几里得距离)最近的k个已知类别的训练样本,从而令得到x对于类的隶属函数。7.(10分)专家经常根据特殊笔迹或特殊长相分类.问如何在一个人脸自动识别系统或笔迹自动识别系统中实现人的这一经验.从数据预处理,特征提取,选择分类器设计等角度描述实现这一经验的方法与可能性.优点?缺点?答:这是一类特殊的图像识别问题,可以采用K-L分类卷二、2008~2009秋_模式识别_张学工_期末B1.(30)?简要介绍下列概念·ROC曲线、交叉验证、似然函数、特征选择与提取、推广能力、随机森林答:ROC曲线(Receiver Operational Characteristic Curve)是以False Positive Rate为横坐标,True Positive Rate为纵坐标的绘制的曲线,通过改变分点给出对应的FP和TP绘成。曲线的点表示了在敏感度和特殊性之间的平衡,例如越往左,也就是假阳性越小,则真阳性也越小。曲线下方的面积越大,则表示该方法越有利于区分两种类别。交叉验证是指交叉验证(Cross-validation)主要用于建模应用中,在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和,这个数越小,表示该方法越好特征选择与提取:特征是指对事物的观测或者某种运算,用于分类。特征提取是指直接观测到或者经过初步运算的特征——原始特征。特征选择是指从m个特征中选择m1个,m1m。特征提取(特征压缩、变换)将m个特征变为m2个新特征。推广能力:在有限的样本上建立的学习机器对未来样本的表现。随机森林是指通过bootstrapping 样本来生成许多决策树,对于决策树上的

文档评论(0)

df9v4fzI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档