1表单自动处理方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
内容目录 图目录 图1.1表单内容识别图示………………………………………………,4 图1.2表单应用层次图示……………………………………………….5 图1.3表单自动处理层次示意…………………………………………6 图2.1表单和描述文件示例…………………………………………。12 图2.2表单自动处理方法模型……………………………………….14 图2.3表单自动处理系统结构…………………………………………16 图3.1支票二值化示例…………………………………………………19 图3.2支票二值化示例………………………………………………。19 图3.3连通体分析示例…………………………………………………20 图3.4固定宽高比倾斜角度计算示例……………………………….22 图3.5表单锚点倾斜示例…………………………………………….23 图3.6,版式分析过程示例……………………………………………24 图3.7表单定位示例……………………………………………………26 图3.8表单图像中的手划线干扰……………………………………。27 图3.9表单图像中的图文混杂和解决办法………………………….27 1lI●●● 内容目录 图3.10支票版面差异示例……………………………………………29 图3.11表单特征比对流程示意………………………………………34 图3.12不同表单类型宽高比示例……………………………………35 图4.1IcoIlIab表单处理系统样张示例………………………………..37 图4.2彩色支票处理系统样张示例…………………………………。39 图4.3几种机读卡处理系统样张示例……………………………….41 内容目录 表目录 表4.1彩色支票处理系统识别率测试结果………………………….39 表4.2机读卡表单处理系统性能评测………………………………。42 表4.3表单图像检测系统评测数据…………………………………..43 第一章引言 第一章引言 第一节论文背景的介绍与问题提出 1.1.1研究背景介绍 表单,作为日常社会生活中信息交互的重要媒介,已经被人们广泛应用了几 个世纪。随着信息技术的不断发展,电子信息化在我们日常的办公和经济生活 中变得越来越重要和流行。尽管如此,在医疗、金融、教育和政府管理等各个 社会部门,我们每天还是要处理数以万计的纸质表单。传统纸质表单作为长久 以来的信息载体,对于并不熟悉电脑操作的一般应用人群,具有使用简易快捷 的特点,在未来相当一段时间内仍旧无法替代。可是传统的纸质载体的信息并 不利于大规模的信息处理,除了备份困难以外,对其进行类别分拣、信息储存 和信息查找需要消耗大量的人工,且容易出错。因此,如何在传统纸质表单和 电子化信息表单之间搭建一座互通的桥梁,实现一整套表单综合处理系统的方 法,对于提高信息处理的效率,提高社会的信息自动化水平具有重要意义。 从二十世纪六十年代开始,基于OCR技术的自动文档处理得到了广泛的研究, 许多成熟的OcR产品具有了较高的处理速度和识别精度,在很多商业领域得到 了应用。通过OCR技术,人们可以自动地将图形化的文字信息转化为计算机可 自动处理的编码信息,不仅免去了繁重的信息录入过程,而且使得大规模的信 息处理成为可能。因此,0cR技术的发展和成熟,使表单自动处理获得了技术依 托。 1.1.2问题的提出以及研究现状 ocR技术可以有效地识别文档图像中的文字信息,表单图像也是属于文档图 像中的一种,但是它和普通的文档图像相比,又有自身的特点,具体表现在以 下几个方面: l,表单版面结构变化多样,定位与处理方法差异很大 有的表单有明显的定位标记(如AnchorPoint),有的表单则缺少明显 第1页

文档评论(0)

蝶恋花 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档