CN119493820A 面向工业领域的文档信息抽取方法 (复旦大学).docxVIP

  • 0
  • 0
  • 约9.81千字
  • 约 16页
  • 2026-05-05 发布于山西
  • 举报

CN119493820A 面向工业领域的文档信息抽取方法 (复旦大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119493820A

(43)申请公布日2025.02.21

(21)申请号202311032603.5

(22)申请日2023.08.16

(71)申请人复旦大学

地址200433上海市杨浦区邯郸路220号

(72)发明人黄文皓赵津梁家卿冯红伟肖仰华

(74)专利代理机构上海德昭知识产权代理有限

公司31204

专利代理师程宗德

(51)Int.Cl.

G06F16/25(2019.01)

G06N20/00(2019.01)

权利要求书2页说明书5页附图2页

(54)发明名称

面向工业领域的文档信息抽取方法

(57)摘要

CN119493820A本发明提供了一种面向工业领域的文档信息抽取方法,具有这样的特征,包括以下步骤:步骤S1,对通用大模型进行第一阶段微调,得到简单微调模型;步骤S2,根据现有的公开数据构建复杂抽取指令数据集;步骤S3,根据复杂抽取指令数据集对简单微调模型进行第二阶段微调,得到复杂微调模型;步骤S4,对现有的目标场景的文档数据进行转换,得到对应的工业领域抽取数据集;步骤S5,根据工业领域抽取数据集对复杂微调模型的模型参数进行低秩调整得到适配模型;步骤S6,将原始工业文档以及预设的抽取任务指令和提示输入适配模型得到抽取信息。总

CN

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档