- 0
- 0
- 约1.58万字
- 约 23页
- 2026-01-26 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119293212A(43)申请公布日2025.01.10
(21)申请号202411384735.9
(22)申请日2024.09.30
(71)申请人华中科技大学
GO6N3/0895(2023.01)
GO6N3/084(2023.01)
GO6N5/022(2023.01)
GO6N5/04(2023.01)
地址430074湖北省武汉市洪山区珞喻路
1037号
(72)发明人李瑞轩陈玉婷王号召齐伊宁邹逸雄李玉华
(74)专利代理机构华中科技大学专利中心
42201
专利代理师尹丽媛
(51)Int.CI.
GO6F16/334(2025.01)
GO6F16/36(2019.01)
GO6F40/30(2020.01)
GO6N3/0455(2023.01)
权利要求书2页说明书8页附图3页
(54)发明名称
一种基于自适应上下文学习的因果事理图谱形成模型构建方法
(57)摘要
CN119293212A本发明属于自然语言处理领域,具体涉及一种基于自适应上下文学习的因果事理图谱形成模型构建方法,因果事理图谱形成模型包括检索器和大语言模型,构建方法分为检索器预训练和自适应上下文学习微调两阶段,利用对比学习损失构建基于自监督学习的样本检索器,实现优化文本向量表征;另外,设计出包含样本示例的提示词,结合自适应上下文学习策略,微调大语言模型,使得大语言模型捕捉相似样本中的事件因果关系模式,提高隐式事件因果关系抽取的准确性。本发明方法能充分挖掘文本中的事理逻辑知识,提高了隐式因果事件关系的抽取准确性,从
CN119293212A
检素器预训练阶段
检素器预训练阶段自适应上下文学习微调阶段
输出:(上游原材料涨价,产品成本上升)
对比?习报失
ChatGLM3
你现在是一个事件因果关系抽取模型。请帮我从确入中抽取出所有的因果事件对,以原因事件,结菜事件的格式回答,
SentEncoder
输人:愿材料价格上涨,并导致生产成本增加.
输入上游原材料图价,产品成本上升.
原材年价格上涨,并导致生产成本结加.
RoBERTa-
CN119293212A权利要求书1/2页
2
1.一种基于自适应上下文学习的因果事理图谱形成模型构建方法,其特征在于,包括:
构建训练样本集,每个样本包括一个句子及其对应的因果三元组;采用训练样本集训练由检索器和大语言模型所构成的因果事理图谱形成模型;
其中,训练过程中对训练样本集分批次输入待训练检索器,每一批次有K个训练样本,该检索器对每批次中每个训练样本的句子均进行两次编码得到两个句子特征表示h,h,
构成该句子的一个正示例对,将该句子的句子特征表示h与该批次中其它每个句子的h构成一个负示例对,得到K-1个负示例对;以最大化每个句子的正示例对相似度与各负示例对相似度总和的差别为目标,优化检索器参数,完成检索器训练;
采用训练后的检索器对每个训练样本的句子进行一次编码得到句子特征表示,从所有其它训练样本中搜索出句子特征表示与该句子的句子特征表示之间的相似度达到预设阈值的句子,并将该句子及其对应的因果三元组分别作为待微调大模型的输入输出示例,将预设任务描述、该输入输出示例和当前训练样本的句子输入大模型,根据大模型的输出与当前训练样本中真实的因果三元组的偏差,调整大模型参数,实现大模型微调。
2.根据权利要求1所述的因果事理图谱形成模型构建方法,其特征在于,在训练检索器过程中,还随机生成一个与每个训练样本中句子的序列长度相同的MASK序列M,对该训练样本中句子的h和该MASK序列M点乘得到编辑句子特征表示,基于该训练样本中句子的h和该编辑句子特征表示,采用编码器预测MASK序列M,以最小化该训练样本对应的MASK序列M和MASK序列M之间的偏差以及最大化每个句子的正示例对相似度与各负示例对相似度总和之间的差别为目标,优化检索器参数,完成检索器训练。
3.根据权利要求1或2所述的因果事理图谱形成模型构建方法,其特征在于,在优化检索器参数时,以最大化每个句子的正示例对相似度与各负示例对相似度总和之间的差别为目标所对应
您可能关注的文档
- CN119296516A 基于rag的领域化语音识别方法及系统 (中科南京人工智能创新研究院).docx
- CN119296378A 一种船舶用的智能航行系统及方法 (广东海洋大学).docx
- CN119296376A 一种基于多模态物联感知的公路风险模拟避让系统及方法 (四川云控交通科技有限责任公司).docx
- CN119296322A 基于全息图的路网安全预警方法、装置及存储介质 (深圳市拓必达科技有限公司).docx
- CN119296239A 基于视频远程监控的防盗监测预警方法 (广州市伟粤通讯设备有限公司).docx
- CN119295886A 基于多尺度特征融合的X-ray图像违禁品检测方法 (齐鲁工业大学(山东省科学院)).docx
- CN119295883A 一种基于多模态感知融合的自主机器人决策系统及其方法 (龙岩丽泰信息技术有限公司).docx
- CN119295827A 通过深度学习增强缺陷检测效率的无损探伤方法 (苏州天顺复合材料科技有限公司).docx
- CN119295660A 一种深度学习和计算机视觉的桥梁结构裂缝位置识别方法 (广州航海学院).docx
- CN119295638A 基于高斯泼溅的图像渲染方法、装置、设备、存储介质及程序产品 (北京大学深圳研究生院).docx
- 2026广东佛山顺峰中学诚聘语文历史地理临聘教师3人笔试考试参考题库及答案解析.docx
- 2026常德烟草机械有限责任公司招聘35人笔试考试备考试题及答案解析.docx
- 2026湖北省东风汽车集团有限公司研发总院高管岗位竞聘1人笔试考试备考试题及答案解析.docx
- 2026重庆市涪陵区武陵山镇人民政府招聘公益性岗位1人笔试考试参考试题及答案解析.docx
- 2026山东事业单位统考威海经济技术开发区镇街招聘初级综合类岗位15人笔试考试参考试题及答案解析.docx
- 2026广东广州市教育局直属事业单位广州市第六中学第一次招聘教师28人笔试考试参考题库及答案解析.docx
- 2026甘肃平凉市儿童康复医疗中心招聘非在编人员5人笔试考试备考题库及答案解析.docx
- 2026江苏扬州市兴业劳务派遣有限公司招聘3人笔试考试备考试题及答案解析.docx
- 2026贵州省市两级机关遴选公务员笔试考试参考题库及答案解析.docx
- 2026年春季广东中山市东区艳阳学校教师招聘笔试考试参考试题及答案解析.docx
原创力文档

文档评论(0)