- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
联机手写汉字/词组识别的研究及其应用
由于在移动数码设备(例如智能手机、掌上电脑、学习机等)以及平板电脑(Tablet PC)上的巨大应用价值,联机手写汉字识别技术在近20多年来一直是模式识别领域中的一个重要研究课题, 经过多年的研究工作,目前国内外许多研究机构(例如汉王、清华大学、Microsoft等)所研制的系统已经能较好地识别与笔顺无关、常规连笔书写的手写体汉字,不少系统已经可以达到98%以上的识别率。但高自由度的草书识别及无约束的手写词组的识别仍然是未解决的问题,而这两个难题恰好是构造更自然、更快捷、更流畅的手写输入方式的核心技术,是使手写输入法变得更实用、更具竞争力的关键所在,因而具有较大的研究价值。本文介绍了我们在微软亚洲研究院高校合作研究项目资助下所开展的相关研究工作及取得的一些研究结果。
一、联机手写汉字识别的预处理技术
预处理的目的是减少数据采集过程中的噪声、规范书写形状、减少不同书写风格的差异性,以便提高识别性能。对联机手写汉字识别而言,我们采用的预处理技术主要包括:
?线性规一化:给定一个实时书写的手写汉字样本,可以用比值线性方法将它被规一化到一个固定的N×N范围内(一般N取值64)。
?重采样:重采样的目的是减少在联机数据中两个连续点的距离的变化和一个笔划的采样点的数目变化,具体做法是每一笔划的数据点序列被等距离(2~5个像素)重新采样。
?增加虚拟笔划:虚构的笔划是指书写过程中,在起笔状态下,那些笔尖的运动的轨迹,这些信息没有被原始的字符样本所记录。一个虚构笔划即是从一个落笔状态结束点到下一个落笔状态下的开始点的一条直线。
?非线性规范化:首先将联机字符样本映射到一幅位图,然后由点密度或线密度非线性均衡方法推导得出的变换函数,在利用该变换函数将联机字符序列转化为新的规范化样本序列。
上述预处理技术中,虚拟笔划可以训练识别器更好地识别草书连笔的手写文字;重采样技术能有效去除书写过程中的抖动噪声,可以使手写汉字变得平滑。非线性规范化技术可以减少不同书写风格之间的变形,是汉字识别中的一个十分重要的预处理技术,当然,我们的研究还发现,如果不用非线性规范化技术而采用弹性网格技术,一样可以达到对不同书写风格的手写汉字进行规范化处理的效果,有时能比非线性规范化效果更好。
二、四种用于联机识别的特征提取方法
特征提取是手写文字识别的关键环节之一,经过多年的研究,目前方向特征已经成为手写文字识别的常用特征及主流特征之一,其中典型的代表有方向线素特征、Gabor特征、梯度(Gradient)特征、方向变化特征等。我们对比研究了目前在手写汉字识别中比较先进的四种方向特征提取方法,分别是梯度特征、4方向Gabor特征、8方向特征、方向变化特征。上述四种特征之中,8方向特征及方向变化特征可直接在联机样本上提取。梯度特征及Gabor特征原本是用来进行脱机手写文字识别,并已证实能获得很高的识别性能(通常使用Gabor+ MQDF+MCE或Gradient + MQDF+MCE对863的规范脱机手写汉字库HCL2000的识别率已能达到98%以上),但它们同时也可用来对联机手写数据提取特征,以解决笔顺无关的联机手写识别问题,但特征提取前需要先将联机数据映射为二维位图。
我们使用与香港大学联合采集的联机手写汉字数据进行测试(该数据库版权属香港大学所有),总共含300个不同书写者在掌上电脑上无限制自由书写的手写体汉字(其中一部分样本具有草写风格),每套样本含3755类汉字。使用其中200套进行训练,其余100套用作测试,对四种特征分别用 LDA(Linear Discriminant Analysis)降维,采用MQDF作为分类器,识别结果如表1所示。
表1 四种特征提取方法在联机识别中的性能对比
特征 8方向特征 8方向变化特征 Gabor特征 梯度特征
识别率 96.05% 95.53% 88.29% 93.73%
表1显示8方向特征取得了最好的识别性能,尽管Gabor特征及梯度特征性能没有8方向特征优良,但它们具有对笔顺不敏感的优点,因此可以结合8方向特征构造综合集成系统,各种特征可以结合不同的分类器设计方法(例如联机特征可使用HMM、DTW等分类器,脱机特征可使用LDA+MQDF+MCE或LDA+LVQ分类器方法),然后进行多分类器的集成,相信集成后的分类系统识别性能还能得到较大的提高。
三、基于改进的LDA及核LDA的手写文字识别方法
线性判决分析(LDA,Linear Discriminant Analysis)是模式识别中一种优良的特
文档评论(0)