- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120234386A(43)申请公布日2025.07.01
(21)申请号202510262491.5
(22)申请日2025.03.06
(71)申请人大连理工大学
地址116024辽宁省大连市甘井子区凌工
路2号
(72)发明人申彦明马振循
(74)专利代理机构大连星河彩舟专利代理事务所(普通合伙)21263
专利代理师马新月
(51)Int.CI.
GO6F16/3329(2025.01)
GO6F16/334(2025.01)
GO6F16/338(2019.01)
权利要求书4页说明书10页附图1页
(54)发明名称
一种面向检索增强生成系统的检索联合优
化方法
(57)摘要
CN120234386A本发明涉及人工智能技术领域,提出面向检索增强生成系统的检索联合优化方法,包括构建大语言模型的知识库和向量库,获取用户的输入问题;将输入问题与大语言模型的知识库和向量库进行关键字匹配和相似性比较,根据结果从知识库中抽取文本块,得到初始检索候选集;提取初始检索候选集与大语言模型内部的相关信息,生成初始外部相关信息块集和内部相关信息块集;对初始外部相关信息块集进行渐进式信息验证,得到外部相关信息块集;整合内部相关信息块集和外部相关信息块集,去除冲突信息,生成最终检索结果;将用户的输入问题和最终检索结
CN120234386A
构建大语言模型的知识库和向
构建大语言模型的知识库和向量库,获取用户的输入问题
将输入问题与大语言模型的知识库和向量库进行关键字匹配和相似性比较,根据相似性比较和关键字匹配的结果从知识库中抽取文本块,得到初始检索候选集
提取初始检索候选集与大语言模型内部的相关信息,生成初始外部相
关信息块集和内部相关信息块集
对初始外部相关信息块集进行渐进式信息验证,得到外部相关信息块集
整合内部相关信息块集和外部相关信息块集,去除冲突信息,生成最终检索结果
将用户的输入问题和最终检索结果发送给大语言模型,大语言模型生成对应的回答
CN120234386A权利要求书1/4页
2
1.一种面向检索增强生成系统的检索联合优化方法,其特征在于,包括如下步骤:
S1.构建大语言模型的知识库和向量库,获取用户的输入问题;
S2.将步骤S1中得到的所述输入问题与大语言模型的知识库和向量库进行关键字匹配和相似性比较,根据相似性比较和关键字匹配的结果从所述知识库中抽取文本块,得到初始检索候选集;
S3.提取步骤S2中得到的所述初始检索候选集与大语言模型内部的相关信息,生成初始外部相关信息块集和内部相关信息块集;
S4.对步骤S3中得到的所述初始外部相关信息块集进行渐进式信息验证,得到外部相关信息块集;
S5.整合步骤S3中得到的所述内部相关信息块集和步骤S4中得到的所述外部相关信息块集,去除冲突信息,生成最终检索结果;
S6.将用户的输入问题和步骤S5中得到的所述最终检索结果发送给大语言模型,大语言模型生成对应的回答。
2.根据权利要求1所述的一种面向检索增强生成系统的检索联合优化方法,其特征在于,所述步骤S1中所述构建大语言模型的知识库和向量库包括:获取知识库文档,将所述知识库文档分割成文本块,得到由文本块构成的知识库;采用嵌入模型将所述文本块进行向量化,生成向量块,得到由向量块构成的向量库。
3.根据权利要求2所述的一种面向检索增强生成系统的检索联合优化方法,其特征在于,所述嵌入模型为bge-m3,采用数据库FAISS构建向量库。
4.根据权利要求2所述的一种面向检索增强生成系统的检索联合优化方法,其特征在于,所述步骤S2包括如下步骤:
S201.通过BM25算法分别计算用户的输入问题与所述知识库D中每个文本块的相似性,得到关键字匹配结果,如公式(1)所示:
(1)
其中,rBM25表示用户的输入问题与知识库中文本块的相似性,d∈D,d表示文本块,Q表示问题,Q={?,q?,…,an},M表示问题中的词数,q;表示问题中的第i个词项,i∈(1,2,3,…,M),f(q,,d)表示词项q;在文本块d中出现的频率,len(d)表示文本块d的中词语的数量,avg_len表示知识库中所有文本块中词语的平均
您可能关注的文档
- CN117725480B 一种避雷器故障智能检测方法及系统 (国网山东省电力公司青岛供电公司).docx
- CN117810391B 正极材料及其制备方法、电池 (深圳市贝特瑞纳米科技有限公司).docx
- CN117861676B 双催化中心催化剂及其制备方法和应用和二元醇的制备方法 (中国石油化工股份有限公司).docx
- CN117911584B 基于文本提示词和图像驱动的内容生成方法、设备、介质 (上海人工智能创新中心).docx
- CN117985557B 一种电梯集群控制方法及系统 (尼得科康迪克电梯技术(无锡)有限公司).docx
- CN117993287B 一种铅铋反应堆智能设计优化方法 (南华大学).docx
- CN118041102B 一种消除中点电流的三相四桥臂三电平逆变器调制方法 (华中科技大学).docx
- CN118120007B 一种面板显示方法、装置、系统、设备及存储介质 (京东方科技集团股份有限公司).docx
- CN118188373B 使用含能改性工质的重频等离子体射流点火系统及方法 (西安交通大学).docx
- CN118365884B 用于三维磁共振图像的双向注意力并行网络分割方法 (河北工程大学).docx
- 全球体育产业营销创新与发展趋势前景展望研究报告.docx
- 金融行业市场现状发展趋势及投资机遇分析研究报告.docx
- 精密仪器设备生产制造工艺技术创新市场拓展资本利用投资决策研究申请.docx
- 金融科技应用领域市场深度解析及发展趋势与商业布局规划报告.docx
- 金属加工行业市场供需现状及投资趋势评估分析报告.docx
- 金融投资行业市场供需分析投资回报评估风险控制市场策略研究报告规划.docx
- 中国服装打印机行业趋势前景预判与需求潜力分析研究报告.docx
- 中国眼科电动手术床行业供需趋势及投资风险研究报告.docx
- 能源产业新行业市场细腻研究及发展趋势与投资创新战略报告.docx
- 2025-2030工业互联网平台标准化建设进程与中小企业数字化转型研究.docx
最近下载
- 基于三维空间信息技术的工程数字化交付技术规范(征求意见稿).pdf VIP
- 2026人教版小学一年级上册数学期末考试3套试卷打印版(含答案解析).docx
- 西藏事业单位招聘考试题历年公共基础知识真题及答案汇总-综合应用能力含详解.docx VIP
- 2025年无存储危险化学品单位安全管理制度.pdf VIP
- 人力资源管理-权责管理手册.xlsx VIP
- 03S402 室内管道支架及吊架建筑工程 图集 .docx VIP
- 医用高值耗材知情同意书.docx VIP
- 《GB/T 23987.3-2025色漆和清漆 实验室光源曝露方法 第3部分:荧光紫外灯》.pdf
- 大学生安全教育第十一章 防灾避险.ppt VIP
- 第二章航空飞行常见疾病的病因及预防.ppt VIP
原创力文档


文档评论(0)