- 1
- 0
- 约1.89万字
- 约 27页
- 2026-06-26 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119782503A
(43)申请公布日2025.04.08
(21)申请号202411852020.1
(22)申请日2024.12.16
(71)申请人佛山市规律未来智能科技有限公司
地址528312广东省佛山市顺德区陈村镇
广隆工业区环镇东路4号顺智科创园7
栋802-1室(住所申报)
(72)发明人吴见乐谢丰泽何骁
(74)专利代理机构广州圣理华知识产权代理有限公司44302
专利代理师李唐明
(51)Int.Cl.
G06F16/334(2025.01)
G06F16/338(2019.01)
G06F40/30(2020.01)
权利要求书3页说明书9页附图2页
(54)发明名称
一种基于LLM的文档结构化自动处理方法及
系统
(57)摘要
CN119782503A本发明公开了一种基于LLM的文档结构化自动处理方法及系统,涉及文档处理技术领域,包括步骤:S1、文档输入和预处理:去除无序文本中的特殊字符、统一编码格式,调整其语义密度;S2、去冗余和关键词提取:去除无序文本中的重复信息,并提取第一关键词;S3、语义抽取和结构化:根据第一关键词逐句解析无序文本,抽取每一个句子对应的主要意义和相关语义信息,得到抽取结果,包括同一个句子的第二关键词
您可能关注的文档
- CN119782191A 基于跨多状态的协议模糊测试方法及系统 (杭州电子科技大学).docx
- CN119782192A 一种针对安全型数据库密码模块边界的测试方法 (天津南大通用数据技术股份有限公司).docx
- CN119782217A 可拓展配件的控制器系统及交互方法 (广州市品众电子科技有限公司).docx
- CN119782218A 存储器系统及其操作方法、电子设备及其操作方法 (北京小米移动软件有限公司).docx
- CN119782240A 基于SPI Slave启动从设备的配置方法及系统 (中科亿海微电子科技(苏州)有限公司).docx
- CN119782258A 一种基于区块链的数字档案管理方法以及系统 (北京华普亿方科技集团股份有限公司).docx
- CN119782259A 一种基于边缘算法的批量文献智能化管理系统及方法 (中国标准科技集团有限公司).docx
- CN119782287A 一种多层次多专业的cad模型库管理方法、系统及介质 (山东华云三维科技有限公司).docx
- CN119782288A 特征自动化迁移方法及装置 (上海数禾信息科技有限公司).docx
- CN119782289A 一种数据排序方法、存储介质与设备 (中电科金仓(北京)科技股份有限公司).docx
- CN119782507A 基于数据库和大模型的科技查新报告自动生成方法及系统 (中图科信数智技术(北京)有限公司).docx
- CN119782507B 基于数据库和大模型的科技查新报告自动生成方法及系统 (中图科信数智技术(北京)有限公司).docx
- CN119782508A 基于Solr的全文检索方法、系统、设备及介质 (浪潮软件股份有限公司).docx
- CN119782509A 题目推荐方法、系统、电子设备及存储介质 (资优信息技术(东莞)有限公司).docx
- CN119782512A 一种融合外部知识和句法结构的多通道短文本匹配方法 (长安大学).docx
- CN119782515A 基于推测性检索增强生成的发电系统故障快速处置方法 (水电水利规划设计总院).docx
- CN119782533A 多视角学习的信息抽取方法、装置、电子设备及存储介质 (北京邮电大学).docx
- CN119782534A 一种电力行业智能问答多知识库分类优化方法及其系统 (烟台海颐软件股份有限公司).docx
- CN119782537A 一种基于bim技术的工程造价动态数据标注方法及系统 (四川志恒工程管理咨询有限公司).docx
- CN119782537B 一种基于bim技术的工程造价动态数据标注方法及系统 (四川志恒工程管理咨询有限公司).docx
原创力文档

文档评论(0)