形似字库生成方法及系统.pdfVIP

  • 1
  • 0
  • 约3.28万字
  • 约 24页
  • 2023-12-20 发布于四川
  • 举报
本申请公开了一种形似字库生成方法及系统,用以解决低质量样本字单元构成的形似字库导致文字校对系统识别效率较低的技术问题。其中,一种形似字库生成方案,通过从表意文字描述序列、笔画序列两个筛选维度确定目标字单元的形近字单元,相互补充各筛选维度遗漏的形近字单元,得到较为全面的综合形近字集合。之后对综合形近字集合内若干形近字单元分别以四角号码序列、字频两个评价维度,进一步筛选出容易出现输入错误的形近字单元,构成形似字库。这样的形似字库体量适中、质量较高,适用于日常的文字校对,能够提高文字校对系统的识别效率

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN117252192A

(43)申请公布日2023.12.19

(21)申请号202311303903.2

(22)申请日2023.10.09

(71)申请人北京华宇信息技术有限公司

地址

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档