- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于结构的票据定位新方法
一种基于结构的票据定位新方法*
夏富春1 苗夺谦2
1 同济大学计算机科学与工程系,上海(200092)
2 国家高性能计算机工程中心同济分中心,上海 (200092)
1 2
Fuchunxia2003@ miaoduoqian@163.com
摘要:在票据识别中,票据定位的正确性直接影响识别率。本文提出了一种基于结构的票据定位新方法。
它主要利用票据主边框上交叉点的个数和相对位置作为票据的特征信息,根据定义相应的分类相似函数
集对票据进行分类,最终提取当前票据的识别区域。实验结果表明:该算法取得了很好的定位性能和准
确率。
关键字:票据定位;特征提取;相似函数
1 引 言
票据定位指的是从一个票据扫描图像(bmp 和 jpg 或 jpeg 格式居多)中,通过某种策略和方法寻
找到用户感兴趣的区域,并从图像中提取出来,以图像文件的格式保存起来,作为票据定位后处理的输
入。这些后处理包括二值化、边框处理、切割、识别等。在这一系列连续的处理过程中,票据定位非常
重要。因为它不仅仅为后面的处理提供输入,更重要的是票据定位的效率和性能决定了整个票据识别的
性能。
在参考别人定位算法的基础上[1-3] ,通过观察票据自身的特点,发现不同种类的票据在结构上存在
很大差别。这些差异主要体现在票据的大小,主边框上交叉点,主边框的宽度和高度等. 在这基础上我
们自己提出了一种基于结构的票据定位新方法。
该方法主要由两个部分组成,一是票据的特征提取;二是根据特征集对票据分类。在特征提取的过
程中,关键是在票据的众多信息中如何有效地选取票据的特征,并从当前票据中提取出来。在票据分类
的过程中,关键是如何根据当前的票据特征集,依照某种匹配算法,最终将票据的识别区域提取出来。
该定位算法具体如下:
(1).对当前的票据进行一些常规的预处理。它包括票据摆正、初步二值化值选定等。
(2).提取当前票据的结构特征。
(3).根据当前票据的特征点信息,使用分类函数对票据进行分类,并提取票据的识别区域。
(4).对识别区域进行精确定位
2 预处理
票据的预处理是票据识别前的一个规范化操作。从处理特性上分为常规处理和特殊处理。常规处理
主要包括票据的摆正,边界的去污,滤噪音等。特殊处理指的是初步二值化值确定等一系列操作。下面
主要介绍票据摆正和初步二值化值的确定方法。
*本文得到国家自然科学基金项目(No资助
- 1 -
2.1 票据摆正
虽然尽可能在扫描时摆正票据,但还是不可避免的出现票据扫描图像倾斜的情况。进行票据定位前
要计算出票据大致的倾斜角度,并旋转之。这样处理的目的是:降低由于票据倾斜所导致的特征点提取
失败或识别区域提取不精确的概率,进而降低票据识别失败的可能性。
在票据最左边的边框上,依次采取多个有一定间距的点。一般任意选取两个点,求其连线的斜率得
到倾斜角度[6]。为了提高点采样间的独立性和计算的精确度,我们使用最小二乘法对采样点进行一阶拟
合,求出其斜率,进而求出倾斜角度。
θ
如果计算得到角度大于 max 时,拒绝定位和识别该票据,因为当前的票据在经过票据旋转后,失真
θ
较大,对后期的特征点提取和匹配影响较大。而对于角度小于 min 时,可以不进行票据旋转,因为此时
票据倾斜对票据的定位和识别影响非常之小。
2.2 初步二值化值确定
确定初步二值化值的主要目的是将票据的背景和票据图像中的主边框
文档评论(0)