- 0
- 0
- 约2.39万字
- 约 20页
- 2023-06-06 发布于四川
- 举报
本申请实施例公开了一种基于跨语言数据增强的分词方法及装置。本申请实施例提供的技术方案通过采集高资源语言数据处理得到分词语料,采集低资源语言数据获取候选分词,并根据从高资源语言数据处获得的分词语料对候选分词进行甄选,选择与分词语料匹配度高的作为低资源语言数据的分词语料,并根据低资源分词语料进行分词模型的训练,可以实现对低资源语言数据基于模型自动输出分词候选结果,结合分词候选结果与高资源语言数据的分词语料的匹配度进行选取分词结果,通过使用高资源语言的语料对低资源语言的模型训练数据进行自动扩充和验证,
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112765977 A
(43)申请公布日 2021.05.07
(21)申请号 202110034450.2
(22)申请日 2021.01.11
(71)申请人 百果园技术(新加坡)有限公司
您可能关注的文档
最近下载
- 2025生活垃圾焚烧发电锅炉安全运行规范.pdf VIP
- 《家用游戏机发展史》课件.ppt VIP
- 全过程工程造价咨询 投标方案(技术标).doc
- 《学前儿童行为观察》课件_第二章学前儿童行为观察概述.ppt VIP
- 学校教育部党总支书记2025年度述职报告.docx VIP
- 《新大学英语·听视说教程1》课件_Unit 2.pptx
- 七年级下册英语单词表科学普及版.docx VIP
- 2025年无人机驾驶员执照飞行操作事故处理程序专题试卷及解析.pdf VIP
- 2025年项目管理专业挣值管理成本偏差(CV)与进度偏差(SV)专题试卷及解析.pdf VIP
- 2025年项目管理专业模拟与建模技术在定量风险分析中的应用专题试卷及解析.pdf VIP
原创力文档

文档评论(0)