- 2
- 0
- 约2.19万字
- 约 20页
- 2023-05-30 发布于四川
- 举报
本申请提供一种平行语料处理方法、装置、设备及计算机可读存储介质,该方法对目标平行语料进行分句操作,得到目标平行语料中原文文档的M句原文和译文文档的N句译文;对M句原文和N句译文进行编码,得到每句原文对应的一个向量和每句译文对应的一个向量;根据得到的向量,对目标平行语料进行分段操作,得到多个双语互译段;对每个双语互译段,进行对齐操作,得到目标平行语料的对齐结果,降低了工作量,提高了准确性和效率。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112446224 A
(43)申请公布日 2021.03.05
(21)申请号 202011415780.8
(22)申请日 2020.12.07
(71)申请人 北京彩云环太平洋科技有限公司
原创力文档

文档评论(0)