- 0
- 0
- 约2.04万字
- 约 31页
- 2026-01-19 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120258014A(43)申请公布日2025.07.04
(21)申请号202510732964.3
(22)申请日2025.06.04
(71)申请人杭州顺畅智行科技有限公司
地址311121浙江省杭州市余杭区仓前街
道向往街1008号10幢604-2室
(72)发明人李卓林王威郭娇陈辉鸿
(74)专利代理机构苏州浙慧达知识产权代理有限公司32742
专利代理师张迪
(51)Int.CI.
GO6F40/58(2020.01)
GO6F40/295(2020.01)
GO6N5/022(2023.01)
GO6F40/205(2020.01)
GO6F40/30(2020.01)
权利要求书3页说明书12页附图1页
(54)发明名称
一种基于大语言模型的翻译语义纠偏方法及系统
(57)摘要
CN120258014A本发明提出了一种基于大语言模型的翻译语义纠偏方法及系统。属于自然语言处理技术领域;所述方法包括:对数据进行收集;利用大型语言模型进行命名实体识别,从源语言文本中提取具体实体,通过LLM分析实体之间的关系,生成实体对关系;识别并提取实体的属性,并将这些属性与对应的实体进行关联;将提取的实体、关系和属性按照图谱结构进行整合,构建起初步的知识图谱;将源语言文本输入模型进行翻译;将初步翻译结果中的术语与知识图谱进行比对,识别出潜在的语义偏差。对翻译结果进行质量评估。通过将识别并提取的实体之间的关系和属性整
CN120258014A
语境。
对数据进行收集;
对数据进行收集;
S1
利用大型语言模型进行命名实体识别,从源语言文本中提
取具体实体,通过大语言模型分析实体之间的关系,生成
实体对关系;识别并提取实体的属性,并将这些属性与对
应的实体进行关联:将提取的实体、关系和属性按照图谱
结构进行整合,构建起初步的知识图谱;
将源语言文本输入模型进行翻译;
S3
将初步翻译结果中的术语与知识图谱进行比对,识别出潜
在的语义偏差;
S4
对翻译结果进行质量评估。
S5
S2
CN120258014A权利要求书1/3页
2
1.一种基于大语言模型的翻译语义纠偏方法,其特征在于,所述方法包括:
S1、对数据进行收集;
S2、利用大型语言模型进行命名实体识别,从源语言文本中提取具体实体,通过大语言模型分析实体之间的关系,生成实体对关系;识别并提取实体的属性,并将这些属性与对应的实体进行关联;将提取的实体、关系和属性按照图谱结构进行整合,构建起初步的知识图
谱;
S3、将源语言文本输入模型进行翻译;
S4、将初步翻译结果中的术语与知识图谱进行比对,识别出潜在的语义偏差;
S5、对翻译结果进行质量评估。
2.根据权利要求1所述基于大语言模型的翻译语义纠偏方法,其特征在于,所述S1,包
括:
S11、从多渠道对源语言文本和目标语言文本的双语文本数据进行收集;
S12、对实时收集的数据进行预处理。
3.根据权利要求1所述基于大语言模型的翻译语义纠偏方法,其特征在于,所述S2,包
括:
S21、利用大型语言模型进行命名实体识别,提取关键实体,并对识别出的关键实体进行校验;
S22、根据实体类型对实体进行分类,并为其添加标签;
S23、通过LLM分析实体之间的关系,抽取实体对关系;对抽取的关系进行验证,并对关系进行整理,形成结构化的关系网络;
S24、基于LLM和规则匹配技术识别实体的属性,对识别的属性进行校验,同时将属性与对应的实体进行关联,形成属性-实体对;
S25、将提取的实体、关系和属性按照图谱结构进行整合,构建初步的知识图谱;对初步构建的知识图谱进行优化;
S26、将优化后的知识图谱存储于数据库中,并建立高效的索引机制。
4.根据权利要求3所述基于大语言模型的翻译语义纠偏方法,其特征在于,所述S23,包
括:
S231、基于LLM的深度理解能力,对包含实体的文本进行语境分析;通过上下文信息,初步判断实体之间存在的关联或关系;
S232、基于LLM的学习能力,从历史数据或大规模语料库中挖掘出常见的实体关系模式;通过模式匹配,定位文本中可能存在的实体关系;
S233、根据实体类型和关系模式的多样性,制定关系抽取策略;利用LLM的语义解析能力,对文本进行深度解析,抽取实体之间的关系;对
您可能关注的文档
- CN120249957A 一种不锈钢钝化液及其制备方法 (天津金广达金属表面处理有限公司).docx
- CN120252599A 基于非完整曲面拟合的三坐标测量方法 (西安爱德华测量设备股份有限公司).docx
- CN120252688A 基于高斯分布的自适应动态slam方法 (重庆理工大学).docx
- CN120252774A 一种高定位精度车辆自适应导航方法及车载导航仪 (深圳市诺达方舟电子科技有限公司).docx
- CN120252856A 一种基于光纤传感技术的海缆故障在线诊断定位方法及系统 (浙江省邮电工程建设有限公司).docx
- CN120253372A 电子束敏感材料横截面的透射电镜超薄试样制备方法 (浙江大学).docx
- CN120253851A 基于机器视觉的线路板缺陷自动检测方法及系统 (深圳市华富快捷电路有限公司).docx
- CN120254074A 基于声发射的风电叶片缺陷检测方法 (南京安质信工程技术有限公司).docx
- CN120254139A 一种在线多通道快速气相色谱分析系统及方法 (上海圳塑自动化科技有限公司).docx
- CN120254465A 一种基于动态温度监测的电子线束智能耐高温测试方法 (常德富博智能科技有限公司).docx
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
原创力文档

文档评论(0)