CN119647595A 一种面向垂直领域大模型的高质量数据集构建方法及系统 (宁波中科信息技术应用研究院(宁波人工智能产业研究院)).docxVIP

  • 0
  • 0
  • 约1.11万字
  • 约 15页
  • 2026-06-05 发布于山西
  • 举报

CN119647595A 一种面向垂直领域大模型的高质量数据集构建方法及系统 (宁波中科信息技术应用研究院(宁波人工智能产业研究院)).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119647595A

(43)申请公布日2025.03.18

(21)申请号202411723139.9

(22)申请日2024.11.28

(71)申请人宁波中科信息技术应用研究院(宁波人工智能产业研究院)

地址315040浙江省宁波市高新区宁波新

材料科技创新中心东区7幢38号15楼申请人宁波智嘉智能科技有限公司

(72)发明人黄晁肖慧晨赵忆陈辰

方浩杰陈春燕石羚项延发沙鹤

(51)Int.Cl.

G06N5/04(2023.01)

G06F40/289(2020.01)

G06N3/0455(2023.01)

G06N3/082(2023.01)

权利要求书2页说明书5页附图1页

(54)发明名称

一种面向垂直领域大模型的高质量数据集

构建方法及系统

(57)摘要

CN119647595A本发明公开了一种面向垂直领域大模型的高质量数据集构建方法及系统,涉及文本处理技术领域,方法包括:选取种子文本数据并进行长文本处理分割成多个文本片段,使用大模型工具处理文本片段生成种子问答对,并按照预设审核标准进行审核和优化;将提示词、文本片段及种子问答对按照预设的组织规则制作指令生成数据集,利用指令生成数据集对预先选取的基座模型进行微

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档