CN120258137A 一种基于生成式思维链与反馈机制的知识探索方法及系统（上海晏鼠计算机技术股份有限公司）.docxVIP

下载本文档

0
0
约2.4万字
约 39页
2026-01-19 发布于重庆
举报
版权申诉

CN120258137A 一种基于生成式思维链与反馈机制的知识探索方法及系统（上海晏鼠计算机技术股份有限公司）.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN120258137A(43)申请公布日2025.07.04

(21)申请号202510331228.7

(22)申请日2025.03.20

(71)申请人上海晏鼠计算机技术股份有限公司地址200433上海市杨浦区国定路335号1

号楼11001室

(72)发明人陈刚

(74)专利代理机构北京首捷专利代理有限公司

11873

专利代理师蔡凤银

(51)Int.CI.

GO6NGO6N

GO6N

GO6FGO6N

5/04(2023.01)

3/092(2023.01)

3/0985(2023.01)16/36(2019.01)

5/025(2023.01)

权利要求书2页说明书15页附图2页

(54)发明名称

一种基于生成式思维链与反馈机制的知识探索方法及系统

(57)摘要

CN120258137A本发明公开了一种基于生成式思维链与反馈机制的知识探索方法及系统，该方法包括：接收用户输入的多模态查询，进行意图分析识别出核心需求；对多模态查询预处理并提取关键信息，分解复杂问题为多个子问题或子任务；基于生成式思维链动态构建分层推理路径，为每一步推理路径标注逻辑依据；通过动态权重分配优化推理路径优先级，结合元强化学习框架在线动态调整推理策略，优化推理路径；利用因果推理分析工具校验推理路径，生成反事实路径修正错误节点；输出结构化文本及可视化推理过程，并基于博弈论的多人反馈聚合实时优化模型参数。该

CN120258137A

化。

接收用户输入的多模态查询，进行意图分析识别出核心需求、写作主题或问题焦点

对所述多模态查询预处理并提取关键信息，分解复杂问题为多个子问题或子任务

根据所述多个子问题或子任务，基于生成式思维链动态构建分层推理路径，为每一步推理路径标注逻辑依据

通过动态权重分配优化推理路径优先级，结合元强化学习框架在线动态调整推理策略，优化推理路径

在优化推理路径的基础上，利用因果推理分析工具校验推理路径,生成反事实路径修正错误节点

输出结构化文本及可视化推理过程，并基于博弈论的多人反馈聚合实时优化模型参数

S10

S20

S30

S40

S60

CN120258137A权利要求书1/2页

1.一种基于生成式思维链与反馈机制的知识探索方法，其特征在于，包括以下步骤：

S10、接收用户输入的多模态查询，进行意图分析识别出核心需求、写作主题或问题焦点；

S20、对所述多模态查询预处理并提取关键信息，分解复杂问题为多个子问题或子任务；

S30、根据所述多个子问题或子任务，基于生成式思维链动态构建分层推理路径，为每一步推理路径标注逻辑依据；

S40、通过动态权重分配优化推理路径优先级，结合元强化学习框架在线动态调整推理策略，优化推理路径；

S50、在优化推理路径的基础上，利用因果推理分析工具校验推理路径，生成反事实路径修正错误节点；

S60、输出结构化文本及可视化推理过程，并基于博弈论的多人反馈聚合实时优化模型参数。

2.根据权利要求1所述的一种基于生成式思维链与反馈机制的知识探索方法，其特征在于，所述步骤S40中，通过动态权重分配优化推理路径优先级，包括：

根据任务上下文、语义相似度和节点重要性，动态计算推理路径中各节点的权重，权重通过以下公式计算：

式中，w;表示推理节点n的权重；q表示当前查询任务；n表示第i个推理节点；j表示当前路径中所有推理节点的数量；sim(q,n)表示当前任务q与推理节点n的语义相似度；t表示温度系数，用于控制路径探索强度；

根据推理路径分解的多个节点，每个节点对应子任务，并通过奖励模型最大化总奖励值实现路径的最优选择；其中，最大化总奖励值公式如下：

其中，T表示查询任务，R;(T)表示节点的奖励值，k表示当前路径中节点的数量；p表示动态调整的归一化权重系数，p∈[0,1]。

3.根据权利要求2所述的一种基于生成式思维链与反馈机制的知识探索方法，其特征在于，所述步骤S40中，通过动态权重分配优化推理路径优先级，还包括：

融合多模态输入信息，通过对齐损失函数实现文本、图像的语义对齐，其损失函数定义为：

其中，Ⅱab∈{0,1}表示模态关联指示函数，当文本T与图像I相关时为1,否则为0;f(·)和f?(·)分别表示文本编码器和图像编码器，输出

您可能关注的文档

文档评论（0）

aabbcc + 关注: 实名认证

文档贡献者

若下载文档格式有问题，请咨询qq1643702686索取原版

咨询Ta 进入空间

1亿VIP精品文档

更多 >

CN120258137A 一种基于生成式思维链与反馈机制的知识探索方法及系统（上海晏鼠计算机技术股份有限公司）.docxVIP