以贝叶斯定理为架构得基于手写字体应用得可形变模版识别.docVIP

下载本文档

1
0
约1.13万字
约 10页
2017-09-10 发布于浙江
举报
版权申诉

以贝叶斯定理为架构得基于手写字体应用得可形变模版识别.doc

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

以贝叶斯定理为架构得基于手写字体应用得可形变模版识别

以贝叶斯定理为架构的基于手写字体应用的可形变模版识别张国伟，电器和电子工程师协会学生成员杨秩炎，电器和电子工程师协会成员罗兰·T·秦，电器和电子工程师协会成员摘要——有见于可变模型对大形变对象的处理能力，最近人们对于许多模版识别应用都提议运用可变模版技术。此法就是将模版或形状作为可变模型，靠改变自身去迎合输入的图像，然后将萃取的信息导入分类器。这三个部分——建模，匹配和分类——经常被视为独立的任务过程。而在此论文中，我们将学习如何把可变模型集成于贝斯定理架构内，从而使其成为一个对形状建模、匹配、分类的统一方法。并以手写字体识别作为评价这一方法的试验平台。通过对我们系统的使用，无论是仿射变换或其他笔迹变化，都能识别无误。甚至不需要预处理和过多的手工参数设置（如对参数的归一化和字体长度的调整）。除此之外，我们还研究这一问题：如何结合模型适应性约束、加速和子部检测。即便使用只有23个原形的模型集，且无须让软件对识别手迹进行学习，我们的精确度亦可达94.7%，并对NIST SD-1数据集中任何手写阿拉伯数字都不加拒认。索引条目——可变模型，贝叶斯推理，笔迹辨识，预期最大化，NIST数据库。 1.介绍 1.1.可变模版识别基于模型库识别是靠在输入图像中查找预模型而实现的，它的表现和定位有决定性作用，然后才能对其类别分类。通过对具有改变形状能力的可形变模型(DM)的使用，此方法可被用于柔性模版中，如人脸、细胞、手势或手写字体。藉由可形变匹配中提取柔性形状，模型形变和数据失配的量化将由两个判别函数进行：其一负责量度其模型形变程度，其二负责量度数据和形变模型的差别。而最佳匹配就是在此二判别标准的估量总和中取最小值。这估量因数是所谓的正则化参数,它令模型形变和数据失配之间产生一个平衡。通过定义一堆这样的模型，达到区分多种模型类别，而每个模型都包含与其相关的的形状信息，形状的允许形变范围则由预信息或通过软件学习而确定。在现有文献中，这些识别过程的步骤时常被视为分离的，仿佛它们是独立的部分。 1.2. 基于可形变模型库的笔迹辨识的前期工作由于我们可以使用大量现实数据和很多不同风格的笔迹，所以笔迹识别已被用作基于可形变模型库的识别的绝好试验平台，而且在这论文中亦用于评价我们提出的这一系统。在现有文献中，对基于可形变模型库手写数字识别，已有不错的研究。Wakahara提出用于匹配字体形状骨架的局部仿射变换（LAT），这一方法是通过加入一系列点而表现出来的。字体的形变通过邻近的局部仿射变换参数的平滑度来测量，这种测量对球状仿射数据是不变的。数据的错配通过每个数据点到模型的设定数据点的最小距离来测量。Least-squares设置用于最小化，而规则化参数是人手设定的。分类基于差异点的测量。每个原形分类的数字就是一个如此的东西。通过对2，400个数字映象的测试达到的识别率、置换率和拒绝率分别为96.8%、0.2%和3%。Revow et al的研究则把数字模拟成弹性的齿条模型。可变性的模型是通过齿条控制点和涉及向量的Mahalanobis距离测定的。假定输入为二值图，黑像素的分布由高斯分布以及均匀分布的齿条模拟而成，数据的不匹配被定义为反对数的似然函数。最小化的计算通过最大期望值算法来计算，手动设置正则化参数。经BP神经网络的分类，它要萃取一些输入分量，如可形变模型、数据错配和仿射变换参数。每个分类原形就是一个如此的东西。基于CEDAR数据库，最好结果：好的bs的测试组得到1.5%替代率，bs得到3.14%替代率，并且无拒绝。在单独学习时，Jain et al. [5]从智能像素边界模版模拟数字。由一系列置换功能系数构成的平方数来测量。数据错配被定义为模版和输入之间的边缘差异量。经确定斜率算法完成最小化，亦由正则化参数手动设置而成。两个不同量的加权总量达到分类。每一个分类原形大约为二百个，它大大地给此方法一个最邻近分类器的非参特性。根据二千个数字图的NIST SD-1数据集子集，最低的替代率可以达到0%、拒绝率为0.75%。以上的简要说明并无尽述详情，但体现出以下两点：可形变模型库方法对手写识别应用非常见效。不同的可形变模型库识别部分通常单独处理，而不整合为一个完整统一的计算架构。 1.3.论文概述本文中，我们以Revow et al. [8]提出的可形变模型库识别系统作为基础，研究可形变模型库如何完整地代入贝叶斯模型，提供一个用于建模、匹配、分类独立手写字体的完整计算架构。为将我们的系统区别于Revow et al的，我们应用的组合不需手动输入超参数的预处理。此参数值自动设定为集成架构的一部分。这种改进使我们的系统比其他的应用系统更有适应力和移植能力。并且不同于那些用有辨别能力分类器——如BP神经网络——似然模型（或以