一种文件信息的提取方法、装置、设备及可读存储介质.pdfVIP

  • 1
  • 0
  • 约1.65万字
  • 约 15页
  • 2024-01-27 发布于四川
  • 举报

一种文件信息的提取方法、装置、设备及可读存储介质.pdf

本发明公开了一种文件信息的提取方法、装置、设备及可读存储介质,应用于信息提取技术领域,包括:获取待提取文件;利用过滤策略对待提取文件进行过滤,得到目标提取文件;过滤策略为基于文件属性的过滤策略;利用提取方法对目标提取文件的指纹信息进行提取,得到目标文件指纹信息;其中,提取方法为基于文本相似度确定文件指纹信息的算法。可见,和当前仅关注文件内容,不对文件指纹信息进行提取相比,本申请在利用过滤策略对文件进行过滤后,利用基于文本相似度确定文件指纹信息的算法对目标提取文件的指纹信息进行提取,得到目标文件指

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN117453633A

(43)申请公布日2024.01.26

(21)申请号202311596670.X

(22)申请日2023.11.27

(71)申请人杭州安恒信息技术股份有限公司

地址

文档评论(0)

1亿VIP精品文档

相关文档