CN119576920A 一种面向矿山行业大模型的文本数据去噪方法 (煤炭科学研究总院有限公司).docxVIP

  • 2
  • 0
  • 约1.94万字
  • 约 29页
  • 2026-05-16 发布于山西
  • 举报

CN119576920A 一种面向矿山行业大模型的文本数据去噪方法 (煤炭科学研究总院有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119576920A

(43)申请公布日2025.03.07

(21)申请号202510131300.1

(22)申请日2025.02.06

(71)申请人煤炭科学研究总院有限公司

地址100013北京市朝阳区和平里青年沟

东路5号

(72)发明人孙闯程健骆意杨培培贾琨周子博宋郑一凡方乾

(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201

专利代理师白雪静

(51)Int.Cl.

G06F16/215(2019.01)

G06F40/109(2020.01)

G06Q50/02(2024.01)

G06N5/022(2023.01)

权利要求书2页说明书11页附图3页

(54)发明名称

一种面向矿山行业大模型的文本数据去噪

方法

(57)摘要

CN119576920A本申请提出一种面向矿山行业大模型的文本数据去噪方法,包括:确定知识文档中首页的排版状态;其中,知识文档是矿山行业知识库中的文档;确定知识文档的页眉坐标、知识文档中首页的页脚坐标及非首页的页脚坐标;根据页眉坐标和首页的页脚坐标,结合首页的排版状态,对首页进行裁剪,以使裁剪后的首页中只包含正文;根据页眉坐标和非首页的页脚坐标,对非首页进行裁剪,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档