- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
银行支票中非金打印体汉字串识别
硕士论文 银行支票中非金额打印体汉字串识别
摘 要
打印体汉字串识别研究不仅有助于进一步提高金融票据识别系统的自动化处理程
度,而且有利于将打印体汉字串识别在金融票据识别中推向实用,具有其广阔的应用前
景,是一个非常有研究价值的课题。本文以建设银行支票中非金额打印体汉字串为研究
对象,针对预处理、分割、识别和后处理中的一些核心技术进行探讨和研究,并给出具
体有效的解决方法,取得了一定的成果。
对采集的彩色图像进行灰度化处理,针对支票图像中存在红色印章的情况,提出了
有效的灰度化处理策略。首先,判断汉字串颜色(红、蓝、黑);其次,对于蓝色和黑色
的汉字串图像,提出了在保留汉字串区域信息的基础上去除章印影响的算法,对于红色
汉字串图像,志于解决汉字串和印章之间存在明显间隙的情况,先采用加权平均法对彩
色图像直接进行灰度化,再基于二值图像的灰度投影寻找一块空白区域将汉字串和印章
分开,从而消除印章的影响。
对汉字串倾斜校正,在汉字串打印的时候常会出现倾斜的情况,为了便于在后续分
割和特征提取,需要对其进行旋转矫正。对于倾斜角的计算,首先采用直线拟合的方法,
该方法可解决大部分的倾斜情况,对剩余汉字串不是整体倾斜的情况,本文提出了分段
折线拟合进行矫正的方法。两种校正方法相结合取得了理想的校正效果。
对单个字符识别,首先采用最近邻方法将类中心用于汉字一级粗分类来提高汉字识
别速度;其次探讨采用了改进的最近邻分类器对字符进行二级细分类。实验表明,此方
法相比于直接采用近邻方法,其识别速度和识别率都有了显著的提高。
对识别后处理,采用了基于统计的N—gram语言模型和单字识别器相结合的汉字识
别后处理方法;针对识别对象的特殊性,本文提出了基于汉字串查找匹配的识别后处理
方法。最后将两种后处理方法相结合,用15099个样本进行测试,整串识别率为86.72%。
关键字:汉字识别,印章去除,倾斜校正,分割,二级识别,后处理
硕士论文
Abstract
ResearchonPrintedChinesecharacter not further
stringrecognitiononlyhelps improve
theautomatic offinancialnotes alsoisconducive
processiondegree recognitionsystem,but
the
to PrintedChinesecharacter infinancialnotes toward
bring stringrecognition recognition
has isavaluableresearch
abroad
practical.Besides,itapplicationprospects.So,it topic.In
this Chinesecharacterwhichisnon—amountincheck of
dissertation,Printed string image
CCBisselectedastheresearch whichare
object.Severalkeytechniques pre—processing,
and arediscusse
原创力文档


文档评论(0)