- 0
- 0
- 约2.6万字
- 约 37页
- 2026-06-04 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119646161A
(43)申请公布日2025.03.18
(21)申请号202411820212.4
(22)申请日2024.12.11
(71)申请人中国工商银行股份有限公司
地址100140北京市西城区复兴门内大街
55号
(72)发明人刘安平金昕黄俊
(74)专利代理机构中科专利商标代理有限责任
公司11021
专利代理师王雨
(51)Int.Cl.
G06F16/3329(2025.01)
G06F18/214(2023.01)
权利要求书2页说明书13页附图5页
(54)发明名称
偏好学习方法、模型应用方法、装置、设备和
存储介质
(57)摘要
CN119646161A本公开提供了一种偏好学习方法,可以应用于人工智能技术领域。该偏好学习方法包括:从大模型预训练的文本文档中,确定与预设标准相匹配的样本问题,其中,预设标准中包括正向标准和反向标准,样本问题用于表征用户与大模型交互时所产生的问题;将多个样本问题输入大模型中,以根据大模型输出的与每个样本问题对应的答案,生成多个问答对;利用多个评估模型,基于正向标准分别对每个问答对中的答案进行评估,得到与每个问答对对应的评估标签;利用基于评估标签生成的偏好数据,对大模型进行训练,得到与正向标准对齐的
您可能关注的文档
- CN119645670A 系统内存管理单元的配置方法、装置、设备及存储介质 (北京开源芯片研究院).docx
- CN119645671A 多模soc主控芯片的动态功耗调节方法及装置 (东莞市天翼通讯电子有限公司).docx
- CN119645672A 一种gpu内存优化管理方法与系统 (山东浪潮科学研究院有限公司).docx
- CN119645683A 一种带内通信方法、装置和计算机设备和存储介质 (苏州元脑智能科技有限公司).docx
- CN119645688A 一种通信方法、设备、存储介质及计算机程序产品 (苏州元脑智能科技有限公司).docx
- CN119645689A 一种Jailhouse-Hypervisor与SPM的通信方法、装置、设备和介质 (麒麟软件有限公司).docx
- CN119645691A 故障处理方法及装置、设备和介质 (昆仑芯(北京)科技有限公司).docx
- CN119645694A 一种故障处理系统、方法、设备及介质 (苏州元脑智能科技有限公司).docx
- CN119645714A 网络请求处理方法、装置、设备及程序产品 (惠州市乐亿通科技股份有限公司).docx
- CN119645715A 内存数据存储结构、管理方法及内存管理器、内存装置 (昕原半导体(上海)有限公司).docx
- 陕西省西安市高新一中沣东中学等校2026届高三下学期考前阶段自测试题 化学 Word版含答案.docx
- 陕西省西安市高新一中沣东中学等校2026届高三下学期考前阶段自测试题 政治 Word版含答案.docx
- 2026《河北中考•麒麟卷》英语答案.pdf
- 云南省玉溪第一中学2026届高三下学期5月仿真考(二)政治 Word版含答案.docx
- 内蒙古鄂尔多斯市第一中学2026届高三下学期5月诊断考试 物理 Word版含答案.docx
- 内蒙古鄂尔多斯市第一中学2026届高三下学期5月诊断考试 政治 Word版含答案.docx
- 青海省西宁市2026届高三下学期复习检测(二)历史 Word版含答案.docx
- 从消费互联网到智能化生态:文旅产业生态跃迁的动力演进.pdf
- 人工智能赋能企业新质生产力生成——基于培育新质生产力体制的异质性分析.pdf
- 数字经济对我国高端装备制造业技术创新的影响及其作用机制.pdf
原创力文档

文档评论(0)