一种用于快递领域票据识别文本纠错方法.pdfVIP

  • 1
  • 0
  • 约1.12万字
  • 约 9页
  • 2023-04-21 发布于北京
  • 举报

一种用于快递领域票据识别文本纠错方法.pdf

文字识别是利用OCR技术将图片上的文字智能识别成可编辑的文字,可极大提高信息处理的效率。由于复杂的背景、各种字体、成像条件(图像拍摄光线、角度等),经常存在文字识别错误的问题。识别错误会逐级传递放大,并累积至后续链路。因此,有必要对OCR之后的文字进行进一步纠错处理。本专利针对快递领域票据识别场景,提出了一种文本纠错处理方法。采用基于字形混合语言模型进行错误检测,然后替换错原句子中错误字符,通过计算句子得分获取纠正后的句子。该方法在实际应用中能获取较高的准确率和误纠率。从而提升后续NLP任务的性

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113903048 A (43)申请公布日 2022.01.07 (21)申请号 202111207447.2 (22)申请日 2021.10.15 (71)申请人 北京同城必应科技有限公司

文档评论(0)

1亿VIP精品文档

相关文档