基于多特征融合票据分类技术及应用.docVIP

基于多特征融合票据分类技术及应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多特征融合票据分类技术及应用

基于多特征融合票据分类技术及应用   摘 要:在进行票据处理的过程中实现票据快速、准确地分类能够显著提高工作效率,本文针对票据分类的方法进行分析,并指出了其中的利弊。在金融和税务中使用票据具有其自身的特点,根据其特点进行分类能够提高分类的速度。同时也可以根据票据中隐藏的分类条码、特征字符和特征图像等对其进行分类,保证票据分类的效率,同时保证分类的准确性。在银行系统中,采用多特征融合的票据分类技术能够充分证明该方法的实用性。   关键词:多特征融合;票据分类;应用   中图分类号:TP399   票据是在金融、税务等行业的系统业务运转过程中使用到的联系手段。随着加入世贸组织,我国的经济得到了飞速的发展,在各个行业中使用的票据数量逐渐增多,因此也就给票据的处理带来了一定的困难。随着计算机应用技术的不断推广,采用计算机技术进行票据的分析、验证和检索能够显著提高票据处理的速度,保证处理过程的安全性,减轻工作人员的劳动强度。   票据处理技术在未来的使用中呈现出较强的应用趋势,在对票据处理技术的研究中,出版了一些相关的文章,但其主要是针对票据的图像处理和数据域的定位和辨别等方面的内容进行的分析,并没有确切地指出票据分类的相关方法。在出版的文章中只是对票据类型的判断进行了阐述,但这些方法在具体的使用过程中效率较低,准确率也不高,并且只能够对内容中含有特定信息的票据进行处理,难以进行大范围的使用。   1 票据的分类方法   在进行票据的处理时主要按照以下几个步骤进行实施:   (1)使用扫描仪将票据的原始形式进行扫描,之后将其保存到计算机中。   (2)利用计算机对票据图像进行初步处理。   (3)根据票据中的不同图形将其进行分类。   (4)根据票据的不同种类对票据中的数据进行确定和抽取。   (5)对数据域中的数据进行有效识别,如果在识别的过程中产生新型的票据,要及时将票据的相关信息进行整理,并加入到数据库中。   目前,在我国的金融和税务中使用的票据主要为特定表单的形式,在进行处理的过程中要先对票据的整体结构和相关信息以及信息之间的关系进行掌握,由于票据能够在一定时期内保持稳定,因此在确定票据的具体类型后就能够对票据进行处理,有效的提高票据处理的准确性。因此在进行票据的自动处理过程中首先要对票据进行准确分类。   在对票据进行分类的过程中主要使用的方法为:判断票据的主要特征,之后进行分类,其中票据的主要特征包括:字符串、标题、条码等,将票据的这些特征进行收集,建立起相应的特征库,为以后的使用提供有力的参考。在进行票据分类的过程中,可以直接和特征库中的图像进行对比,进而判断出票据的类型。使用这种方法进行分类,具有明显的特点,主要表现为:由于使用的票据种类较多,因此质量存在很大的差异,在进行分类时也就不能够按照一种特征进行分类。例如:在对一些没有条码的票据进行分类时就很难使用条码作为依据进行分类。不含有框线的票据也是如此。   在金融和税务中使用的票据为特定的种类,在进行识别的过程中可以充分利用票据的整体结构信息,针对其中的特征结构信息对其进行识别,之后对提取出的特征进行比较,判断出票据的类型。在票据的判断过程中逐渐形成票据知识库,对票据中的各类特征和组合的特征进行识别,为票据处理提供可靠的依据。票据特征具有多样性,因此在进行票据的抽取过程中使用的方法也各不相同,从而也影响到票据的分类方法,使得票据分类方法呈现出多样性的特点。在票据表现出的特征中,主要有以下几个方面的内容:   1.1 分类条码   在计算机采集和处理数据中通常使用条码的处理方式,随着条码识别技术的逐渐发展,对含有分类条码的数据进行识别,能够保证票据分类的准确性和效率性。   1.2 几何尺寸   利用票据的几何尺寸和票据的像素对其进行分类的方法较简单。在票据中一些票据的几何尺寸具有相似的特点,加上采用图像处理的方法对票据进行分类会出现错误,降低了分类的准确度,因此采用几何尺寸的方法能够显著提高分类的速度。   1.3 票据的标题   在进行票据的分类时根据标题进行分类也是常用的一种方法。在进行分类时,首先要对票据中的图像进行定位,确定其所处的标题区域,之后对其中的文字进行识别,并和知识库中的票据进行匹配,判断出票据的具体类型,但是用这种方法的缺点就在于准确率较低,尤其是一些标题类似的票据,对于一些标题特征不明显的票据也不能够使用这种方法进行分类。   1.4 特征字符串   针对没有标题的票据和标题相似的票据进行分类时就要根据特征字符串进行分类,将字符串作为分类的依据,能够将票据进行准确分类,采用这种方法能够有效地弥补票据标特征不足的忒单,但在进行分类的过程中也要根据字符进行判断,保证分类的准确性。   1.5 特征框线   利用票据的特征框线进行票据分类主要是以票

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档