一种古籍文档顺序检测方法.pdfVIP

  • 0
  • 0
  • 约1.06万字
  • 约 12页
  • 2023-05-13 发布于四川
  • 举报
本发明公开了一种古籍文档顺序检测方法,包括:获取图像数据,基于图像数据进行各个字符的连接顺序标注以及整个文档的文本行顺序标注,获得训练数据集;基于训练数据集,通过空间几何关系构造图的邻接矩阵,构造图中各个结点的特征以及边特征,训练字符连接关系预测模型,得到将字符连接后的文本行;基于训练数据集,通过编码‑解码的序列模型,构建并训练文本行顺序预测模型,获得文本行顺序预测结果;根据图像数据,基于训练字符连接关系预测模型和训练文本行顺序预测模型,获得图像数据的符合阅读顺序的文档内容。本发明针对密集字符型

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114648770 A (43)申请公布日 2022.06.21 (21)申请号 202210354142.2 (22)申请日 2022.04.06 (71)申请人 华南理工大学

文档评论(0)

1亿VIP精品文档

相关文档