- 0
- 0
- 约1.99万字
- 约 32页
- 2026-01-26 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN118916445B(45)授权公告日2025.01.10
(21)申请号202411381973.4
(22)申请日2024.09.30
(65)同一申请的已公布的文献号申请公布号CN118916445A
(43)申请公布日2024.11.08
(73)专利权人南京航空航天大学
地址210016江苏省南京市秦淮区御道街
29号
(72)发明人钱玲飞韦泽楷董嘉嘉马子宜
张泽群
(74)专利代理机构南京禹为知识产权代理事务所(特殊普通合伙)32272
专利代理师颜丹佳
(51)Int.CI.
GO6F16/3331(2025.01)
GO6F16/338(2019.01)
GO6F16/36(2019.01)
GO6F40/279(2020.01)
GO6F16/31(2019.01)
GO6F18/214(2023.01)
GO6F18/22(2023.01)
(56)对比文件
CN112417175A,2021.02.26
CN115391548A,2022.11.25
审查员李芳
权利要求书2页说明书11页附图4页
(54)发明名称
一种骨干光通信设备文档检索优化方法及系统
(57)摘要
CN118916445B本发明涉及语言检索增强技术领域,公开了一种骨干光通信设备文档检索优化方法及系统,方法包括:基于设备文档获取命名实体类型以及关系类型,构建数据结构;基于数据结构,通过大语言模型抽取命名实体和关系词生成至少两个三元组数据;对生成的所有三元组数据进行去重与融合,得到多元组数据,以形成完整的知识图谱;构建文本向量数据库;响应于查询命令,抽取查询命令中的命名实体以及关键词,得到命令实体和命令关键词,并将查询命令转化为嵌入向量;对命令实体、命令关键词和嵌入向量进行混合检索与相似度匹配,获取相应匹配结果并进行去重、融合与重排,得到优化结果,最终生成查询答案,从而提高查询效率和准确率,降低维护成
CN118916445B
基于设备文档获取知识图谱所需的命名实体类型以及关系类型
基于设备文档获取知识图谱所需的命名实体类型以及关系类型
基于命名实体类型以及关系类型,构建并定义数据结构
命名实体和关系词进行抽取,以生成至少两个三元组数据
对生成的所有三元组做据进行去重与融合,以得到优化后的多元组数据
将所述多元组数据存健至图数据库,以形成完整的知识图谱
针对设备文档构建文本向量数据库
确应于用户查询命令,抽取查询命令中的命名实体以及关键词,得剥命令实体和命令关键词,并将查询命令转化为嵌入向量
通过文本向量数据库和知识图谱对命今实体
命令关健词和嵌入向量进行混合检素与相似度匹配。
以分别获取相应的匹配结果
对所述匹配结果进行去重和融合,并与查询命令进行重排,得到优化结果
所述优化结果与提示词结合生成查询答案
S1
S2
S3
54
S5
S6
S8
S9
S10
CN118916445B权利要求书1/2页
2
1.一种骨干光通信设备文档检索优化方法,其特征在于,包括:
基于设备文档获取知识图谱所需的命名实体类型以及关系类型;
基于命名实体类型以及关系类型,构建并定义数据结构;
基于所述数据结构,设置提示符并通过大语言模型对任意设备文档中的命名实体和关系词进行抽取,以生成至少两个三元组数据;
所述三元组数据包括两个命名实体和一个关系词,所述两个命名实体通过一个关系词进行组合连接;
对生成的所有三元组数据进行去重与融合,以得到优化后的多元组数据,包括:
设定去重规则,所述去重规则为对于不同的子设备文档中抽取的同一命名实体,若不同子设备文档属于同一份父文档,则进行去重;
将去重后的结果进行融合得到多元组数据,所述多元组数据包括至少一个三元组数
据;
将所述多元组数据存储至图数据库,以形成完整的知识图谱;
针对设备文档构建文本向量数据库;
具体的,文本向量数据库的构建步骤包括:
进行设备文档预处理;
对预处理后的数据进行文本分块,使用分块工具根据模型的令牌容量进行分块,同时保证语义连贯,得到文本块;
通过Embedding模型将文本块转换为向量;
进行向量数据库存储并进行索引构建;
响应于用户查询命令,抽取查询命令中的命名实体以及关键词,得到命令实体和命令关键词,并将查询命令
您可能关注的文档
- CN119290676A 一种隧道注浆扩散的形态预测系统及方法 (中国矿业大学).docx
- CN119290199A 黑茶加工过程中的发酵监测方法 (湖南省白沙溪茶厂股份有限公司).docx
- CN119290125A 一种基于模糊识别的称重传感器测试补偿方法 (福建云豆网络科技有限公司).docx
- CN119290001A 一种基于数字孪生地图的矿区车辆路径规划方法和装置 (北京路凯智行科技有限公司).docx
- CN119289972A 一种基于强化学习的拒止环境协同自主感知与导航方法 (同济大学).docx
- CN119286993A 用于即时核酸检测的组合物和方法 (武汉大学).docx
- CN119286790A 通用供体细胞和相关方法 (韦尔赛特公司).docx
- CN119286600A 用于从表面去除氧化铈粒子的组合物和方法 (恩特格里斯公司).docx
- CN119286132A 一种防静电pp复合材料及其制备方法 (江西塑高新材料有限公司).docx
- CN119285816A 含氟聚合物的制造方法 (大金工业株式会社).docx
- CN118900205B 基于量子密钥的物联网设备信息安全传输方法及系统 (深圳市旭子科技有限公司).docx
- CN118899072B 一种内分泌失调型肥胖患者的远程护理管理方法及系统 (长春中医药大学附属第三临床医院).docx
- CN118897751B 融合ai模型的rpa业务数据异常检测方法及检测系统 (富璟科技(深圳)有限公司).docx
- CN118890299B 一种自然资源智能监测方法及系统 (龙岩学院).docx
- CN118887107B 一种电阻阵列红外景象图像的图像融合方法 (西安高商智能科技有限责任公司).docx
- CN118885596B 一种校园防欺凌方法、系统、设备及介质 (四川北斗云联科技有限公司).docx
- CN118878209B 一种抗污型陶瓷釉料、陶瓷及其制备方法 (福建省德化县晖德陶瓷有限公司).docx
- CN118877958B 一种镍铁锰铜四元正极材料及其前驱体与制备方法和应用 (宜宾光原锂电材料有限公司).docx
- CN118870253B 用于音响功放器的控制方法、装置 (深圳远虑科技有限公司).docx
- CN118865691B 基于大数据的高速公路拥堵预测方法及系统 (广东省路桥建设发展有限公司路达分公司).docx
原创力文档

文档评论(0)