面向增值税发票的图像自动处理技术研究-软件工程专业毕业论文.docx

面向增值税发票的图像自动处理技术研究-软件工程专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
呈庄骑车E正 面向增值税发票的图像自动处理技术研究 上海交通大学 学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立 进行研究工作所取得的成果。徐文中己经注明引用的内容外,本论文不 包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究 做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意 识到本声明的法律结果由本人承担 。 叫文ft1r 1í: ;急剧 日期:立。!夕年/月川日 Z阵联车E正 面向增值税发票的图像自动处理技术研究 上海交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制 手段保存和汇编本学位论文。 本学位论文属于 保密口,在一一年解密后适用本授权书。 不保密d:。 (请在以上方框内打 (í..j ) 学位论文作者签名:询战队 日期:μ年 f 月.2-{日 日期: I专年/月于日 面向增 面向增值税发票的图像自动处理技术研究 面向增 面向增值税发票的图像自动处理技术研究 万方数据 万方数据 万方数据 万方数据 面向增值税发票的图像自动处理技术研究 摘 要 国内的增值税发票是重要会计计账及企业纳税凭证,具有严格控制的统一格式,并 且广泛存在于企业间的交易往来当中。大中型企业的财务共享中心每日需要处理大量增 值税发票,人工处理增值税发票效率低下,亟需自动化的增值税发票处理系统来降低处 理成本并提高财务管理能力,存在项目需求。企业内部 ERP 实施具备了自动化处理增 值税发票的硬件条件,而 OCR 等关键图像识别技术的成熟商业化以及大量图像处理和 识别技术的发展使得增值税发票自动处理系统的实现成为可能。 本文重点研究了实现增值税发票自动化处理过程中所需的多项图像处理技术,提出 了一些极具针对性的应用技术及改进,并在企业的实际项目中成功地实现了增值税发票 的自动化处理应用,取得良好的运行效果。 本文论述的发票自动处理系统以批量方式从高速扫描仪获取发票及附件的高质量 彩色图像,接着按色彩分割出多个分量并同时对原图和各分量进行二值化处理,从原图 和表格分量中提取出发票的表格用于判断发票的类型,在对图像纠正偏斜后再按类型及 表格结构裁剪出需要识别的文本子图用于 OCR 识别。在进行 OCR 识别时,同时使用 多个不同的 OCR 引擎,并且结合业务数据对不同引擎的识别结果做校验。最终把通过 校验的识别数据直接导入企业的业务系统以驱动相关业务,而对于未获通过的数据则告 知职员进行编辑、确认。 本文首先交代了图像处理的一些基础知识。针对印刷字符的识别问题,提出使用多 个现有的异构 OCR 技术进行混合来实现字符的识别,并配合业务数据校验真伪的方案。 接下来用实验对比研究了基于聚类的二值化方法和邻域自适应的二值化方法,并用基于 聚类的方法改进了基于邻域自适应的方法,验证了经 Kittler 法改进的 Sauvola 法在发 票图像二值化应用中的有效性。接着按发票的色彩特征提出了发票图像的色彩识别和分 割方法。紧接着对已有的基于“有向单连通链” 的表格线检测法进行改进,并在此基 础上提取出发票表格用于类型识别及精细的图像处理等。为了对提取的表格进行类型识 别,本文分别尝试了从距离模型和从有向图结构模型等两类匹配算法对表格类型进行识 别,确认了 Scott 算法和 Blondel 算法的有效性,同时提出匹配偏离点的排除方法和匹 配相似度的评估方法,并以此为基础给出发票自动分类的方法。另外,本文针对发票等 文档图像从表格和文本两个方面都提出了准确的偏斜纠正方法用以对识别前的图像进 - i - 行纠正。最后,本文综合各种图像处理技术和方法并结合软件开发技术把成果应用于项 目实践,并展现了一个正在良好运行的系统实例。 关键词 文档图像处理,表格匹配,图像识别 ii - RESEARCHES ON UNSUPERVISED IMAGE PROCESSING OF VAT INVOICES ABSTRACT Chinese domestic VAT invoice is an important accounting and billing document and is a corporate tax certificate, and it is widely present in dealings among enterprises. The format of it is under strict control of State Administration

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档