- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以贝叶斯定理为架构得基于手写字体应用得可形变模版识别
以贝叶斯定理为架构的基于手写字体应用的可形变模版识别
张国伟 ,电器和电子工程师协会学生成员
杨秩炎 ,电器和电子工程师协会成员
罗兰·T·秦, 电器和电子工程师协会成员
摘要——有见于可变模型对大形变对象的处理能力,最近人们对于许多模版识别应用都提议运用可变模版技术。此法就是将模版或形状作为可变模型,靠改变自身去迎合输入的图像,然后将萃取的信息导入分类器。
这三个部分——建模,匹配和分类——经常被视为独立的任务过程。而在此论文中,我们将学习如何把可变模型集成于贝斯定理架构内,从而使其成为一个对形状建模、匹配、分类的统一方法。并以手写字体识别作为评价这一方法的试验平台。通过对我们系统的使用,无论是仿射变换或其他笔迹变化,都能识别无误。甚至不需要预处理和过多的手工参数设置(如对参数的归一化和字体长度的调整)。除此之外,我们还研究这一问题:如何结合模型适应性约束、加速和子部检测。即便使用只有23个原形的模型集,且无须让软件对识别手迹进行学习,我们的精确度亦可达94.7%,并对NIST SD-1数据集中任何手写阿拉伯数字都不加拒认。
索引条目——可变模型,贝叶斯推理,笔迹辨识,预期最大化,NIST数据库。
1.介绍
1.1.可变模版识别
基于模型库识别是靠在输入图像中查找预模型而实现的,它的表现和定位有决定性作用,然后才能对其类别分类。通过对具有改变形状能力的可形变模型(DM)的使用,此方法可被用于柔性模版中,如人脸、细胞、手势或手写字体。藉由可形变匹配中提取柔性形状,模型形变和数据失配的量化将由两个判别函数进行:其一负责量度其模型形变程度,其二负责量度数据和形变模型的差别。而最佳匹配就是在此二判别标准的估量总和中取最小值。这估量因数是所谓的正则化参数,它令模型形变和数据失配之间产生一个平衡。通过定义一堆这样的模型,达到区分多种模型类别,而每个模型都包含与其相关的的形状信息,形状的允许形变范围则由预信息或通过软件学习而确定。在现有文献中,这些识别过程的步骤时常被视为分离的,仿佛它们是独立的部分。
1.2. 基于可形变模型库的笔迹辨识的前期工作
由于我们可以使用大量现实数据和很多不同风格的笔迹,所以笔迹识别已被用作基于可形变模型库的识别的绝好试验平台,而且在这论文中亦用于评价我们提出的这一系统。在现有文献中,对基于可形变模型库手写数字识别,已有不错的研究。Wakahara提出用于匹配字体形状骨架的局部仿射变换(LAT),这一方法是通过加入一系列点而表现出来的。字体的形变通过邻近的局部仿射变换参数的平滑度来测量,这种测量对球状仿射数据是不变的。数据的错配通过每个数据点到模型的设定数据点的最小距离来测量。Least-squares设置用于最小化,而规则化参数是人手设定的。分类基于差异点的测量。每个原形分类的数字就是一个如此的东西。通过对2,400个数字映象的测试达到的识别率、置换率和拒绝率分别为96.8%、0.2%和3%。Revow et al的研究则把数字模拟成弹性的齿条模型。可变性的模型是通过齿条控制点和涉及向量的Mahalanobis距离测定的。假定输入为二值图,黑像素的分布由高斯分布以及均匀分布的齿条模拟而成,数据的不匹配被定义为反对数的似然函数。
最小化的计算通过最大期望值算法来计算,手动设置正则化参数。经BP神经网络的分类,它要萃取一些输入分量,如可形变模型、数据错配和仿射变换参数。每个分类原形就是一个如此的东西。基于CEDAR数据库,最好结果:好的bs的测试组得到1.5%替代率,bs得到3.14%替代率,并且无拒绝。在单独学习时,Jain et al. [5]从智能像素边界模版模拟数字。由一系列置换功能系数构成的平方数来测量。数据错配被定义为模版和输入之间的边缘差异量。经确定斜率算法完成最小化,亦由正则化参数手动设置而成。两个不同量的加权总量达到分类。每一个分类原形大约为二百个,它大大地给此方法一个最邻近分类器的非参特性。根据二千个数字图的NIST SD-1数据集子集,最低的替代率可以达到0%、拒绝率为0.75%。以上的简要说明并无尽述详情,但体现出以下两点:
可形变模型库方法对手写识别应用非常见效。
不同的可形变模型库识别部分通常单独处理,而不整合为一个完整统一的计算架构。
1.3.论文概述
本文中,我们以Revow et al. [8]提出的可形变模型库识别系统作为基础,研究可形变模型库如何完整地代入贝叶斯模型,提供一个用于建模、匹配、分类独立手写字体的完整计算架构。为将我们的系统区别于Revow et al的,我们应用的组合不需手动输入超参数的预处理。此参数值自动设定为集成架构的一部分。这种改进使我们的系统比其他的应用系统更有适应力和移植能力。并且不同于那些用有辨别能力分类器——如BP神经网络——似然模型(或以
您可能关注的文档
- 九年级数学概率得简单应用1.ppt
- 九年级数学物体得三视图1.ppt
- 九年级数学物体得三视图2.ppt
- 九年级物理九年级物理物质得比热.ppt
- 九年级物理密度、压强浮力得计算.doc
- 九年级物理并联电路中得电阻关系.ppt
- 九年级物理我们周围得材料.ppt
- 九年级物理探究摩擦力得大小与什么有关.ppt
- 九年级物理全册 第十四章《压强和浮力》四、《 流体压强与流速得关系》课件 新人教版.ppt
- 九年级物理探究滑动摩擦力得大小.ppt
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
文档评论(0)