一种网络表格结构的识别方法及装置、计算机装置及计算机可读取存储介质.pdfVIP

  • 0
  • 0
  • 约1.77万字
  • 约 14页
  • 2023-06-17 发布于四川
  • 举报

一种网络表格结构的识别方法及装置、计算机装置及计算机可读取存储介质.pdf

本发明公开了一种网络表格结构的识别方法及装置、计算机装置及计算机可读取存储介质,该方法先通过对输入的HTML文件进行预处理以获取其中的表格相关信息,所述表格相关信息包括单元格文本和单元格所在位置,然后通过利用训练好的网络表格结构识别模型基于获取的单元格文本和单元格所在位置进行网络表格结构的识别,由于采用单元格作为最小识别粒度,相对于现有采用表格行作为识别单位,大大提升了识别结果的准确度,可以适应各种复杂的网络表格结构识别场景。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113268982 A (43)申请公布日 2021.08.17 (21)申请号 202110618601.9 G06F 40/242 (2020.01)

文档评论(0)

1亿VIP精品文档

相关文档