CN113642315A 基于人机协同理念实现的句级平行语料制作方法和系统 (路米科技(江苏)有限公司).docxVIP

  • 2
  • 0
  • 约1.43万字
  • 约 22页
  • 2026-02-07 发布于重庆
  • 举报

CN113642315A 基于人机协同理念实现的句级平行语料制作方法和系统 (路米科技(江苏)有限公司).docx

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号CN113642315A

(43)申请公布日2021.11.12

(21)申请号202110887819.4

(22)申请日2021.08.03

(71)申请人路米科技(江苏)有限公司

地址213000江苏省常州市天宁区北塘河

路8号恒生科技园29幢304室

(72)发明人祁智恒

(74)专利代理机构成都鱼爪智云知识产权代理有限公司51308

代理人张丽

(51)Int.CI.

GO6F40/211(2020.01)

GO6F40/279(2020.01)

GO6F40/58(2020.01)

权利要求书2页说明书7页附图4页

(54)发明名称

S1加载中英文对照文章到源数据文本框S2分别扫描并识别源数据文本框中的中英文句子

S1

加载中英文对照文章到源数据文本框

S2

分别扫描并识别源数据文本框中的中英文句子

S3

分别将当前识别的中英文句子自动拷贝到中英文句子文本框

S4

人工对中英文句子文本框中当前中英文句子做

校对得到人工判断结果,并将人工判断结果输

入至人机协同系统

S5

进入下一句处理

(57)摘要

CN113642315A本发明公开了基于人机协同理念实现的句级平行语料制作方法和系统,涉及句级平行语料制作技术领域,该方法包括:加载中英文对照文章到源数据文本框;分别扫描并识别源数据文本框中的中英文句子;分别将当前识别的中英文句子自动拷贝到中英文句子文本框;人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统;进入下一句处理。通过人机协同系统可以综

CN113642315A

CN113642315A权利要求书1/2页

2

1.一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,包括:

加载中英文对照文章到源数据文本框;

分别扫描并识别所述源数据文本框中的中英文句子;

分别将当前识别的中英文句子自动拷贝到中英文句子文本框;

人工对所述中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统;

进入下一句处理。

2.根据权利要求1所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述分别扫描并识别源数据文本框中的中英文句子的步骤包括:

中文句子的开始指针、结束指针定位到中文文章开始处,英文句子的开始指针、英文句子结束指针定位到英文文章开始处;

分别识别中文和英文中从当前句子开始指针定位的起始位置开始的一个句子,并把中文句子结束指针和英文句子结束指针定位到算法自动识别的句子结束处;

分别在源数据文本框中将识别的当前句子设为选中显示。

3.根据权利要求2所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述中文句子结束指针和英文句子结束指针定位到算法自动识别的句子结束处的步骤包括:

算法从当前位置开始扫描字符,当遇到提前设定的句子结束的标点符号时判断为句子结束处,所述中文句子结束指针和英文句子的结束指针分别定位到句子结束处。

4.根据权利要求3所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,句子结束的标点符号包括逗号、分号、句号、问号和感叹号。

5.根据权利要求1所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统的步骤包括:

人工负责校对算法识别的当前句子是否合理,对应翻译是否准确,下一句识别起始位置是否合理;

若算法识别的当前句子合理、当前句子对应的翻译准确及下一句识别起始位置合理,则将当前句子对应的翻译输入至人机协同系统;

否则,人工修改算法识别的当前句子、修改当前句子对应的翻译及调整下一句识别起始位置,将修改完成后的当前句子对应的翻译输入至人机协同系统。

6.一种基于人机协同理念实现的句级平行语料制作系统,其特征在于,包括:

加载模块,用于加载中英文对照文章到源数据文本框;

扫描识别模块,用于分别扫描并识别源数据文本框中的中英文句子;

拷贝模块,用于分别将当前识别的中英文句子自动拷贝到中英文句子文本框;

人工校对模块,人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档