- 2
- 0
- 约1.43万字
- 约 22页
- 2026-02-07 发布于重庆
- 举报
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号CN113642315A
(43)申请公布日2021.11.12
(21)申请号202110887819.4
(22)申请日2021.08.03
(71)申请人路米科技(江苏)有限公司
地址213000江苏省常州市天宁区北塘河
路8号恒生科技园29幢304室
(72)发明人祁智恒
(74)专利代理机构成都鱼爪智云知识产权代理有限公司51308
代理人张丽
(51)Int.CI.
GO6F40/211(2020.01)
GO6F40/279(2020.01)
GO6F40/58(2020.01)
权利要求书2页说明书7页附图4页
(54)发明名称
S1加载中英文对照文章到源数据文本框S2分别扫描并识别源数据文本框中的中英文句子
S1
加载中英文对照文章到源数据文本框
S2
分别扫描并识别源数据文本框中的中英文句子
S3
分别将当前识别的中英文句子自动拷贝到中英文句子文本框
S4
人工对中英文句子文本框中当前中英文句子做
校对得到人工判断结果,并将人工判断结果输
入至人机协同系统
S5
进入下一句处理
(57)摘要
CN113642315A本发明公开了基于人机协同理念实现的句级平行语料制作方法和系统,涉及句级平行语料制作技术领域,该方法包括:加载中英文对照文章到源数据文本框;分别扫描并识别源数据文本框中的中英文句子;分别将当前识别的中英文句子自动拷贝到中英文句子文本框;人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统;进入下一句处理。通过人机协同系统可以综
CN113642315A
CN113642315A权利要求书1/2页
2
1.一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,包括:
加载中英文对照文章到源数据文本框;
分别扫描并识别所述源数据文本框中的中英文句子;
分别将当前识别的中英文句子自动拷贝到中英文句子文本框;
人工对所述中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统;
进入下一句处理。
2.根据权利要求1所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述分别扫描并识别源数据文本框中的中英文句子的步骤包括:
中文句子的开始指针、结束指针定位到中文文章开始处,英文句子的开始指针、英文句子结束指针定位到英文文章开始处;
分别识别中文和英文中从当前句子开始指针定位的起始位置开始的一个句子,并把中文句子结束指针和英文句子结束指针定位到算法自动识别的句子结束处;
分别在源数据文本框中将识别的当前句子设为选中显示。
3.根据权利要求2所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述中文句子结束指针和英文句子结束指针定位到算法自动识别的句子结束处的步骤包括:
算法从当前位置开始扫描字符,当遇到提前设定的句子结束的标点符号时判断为句子结束处,所述中文句子结束指针和英文句子的结束指针分别定位到句子结束处。
4.根据权利要求3所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,句子结束的标点符号包括逗号、分号、句号、问号和感叹号。
5.根据权利要求1所述的一种基于人机协同理念实现的句级平行语料制作方法,其特征在于,所述人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判断结果输入至人机协同系统的步骤包括:
人工负责校对算法识别的当前句子是否合理,对应翻译是否准确,下一句识别起始位置是否合理;
若算法识别的当前句子合理、当前句子对应的翻译准确及下一句识别起始位置合理,则将当前句子对应的翻译输入至人机协同系统;
否则,人工修改算法识别的当前句子、修改当前句子对应的翻译及调整下一句识别起始位置,将修改完成后的当前句子对应的翻译输入至人机协同系统。
6.一种基于人机协同理念实现的句级平行语料制作系统,其特征在于,包括:
加载模块,用于加载中英文对照文章到源数据文本框;
扫描识别模块,用于分别扫描并识别源数据文本框中的中英文句子;
拷贝模块,用于分别将当前识别的中英文句子自动拷贝到中英文句子文本框;
人工校对模块,人工对中英文句子文本框中当前中英文句子做校对得到人工判断结果,并将人工判
您可能关注的文档
- CN113735496A 一种固废基复合砂浆浸渍板及其制作方法 (山西省交通科技研发有限公司).docx
- CN113730333A 一种用于制作本草防疫香包的配方及其制备方法 (随朴).docx
- CN113725186B 芯片焊盘结构、芯片、晶圆及芯片焊盘结构制作方法 (北京智芯微电子科技有限公司).docx
- CN113725186A 芯片焊盘结构、芯片、晶圆及芯片焊盘结构制作方法 (北京智芯微电子科技有限公司).docx
- CN113715139A 一种用于混凝土预制块的硅胶模具及制作方法及制作工艺 (中建八局发展建设有限公司).docx
- CN113712107B 一种酶法硬化间歇真空浸糖制作柑桔低糖蜜饯的方法 (西南大学).docx
- CN113712107A 一种酶法硬化间歇真空浸糖制作柑桔低糖蜜饯的方法 (西南大学).docx
- CN113711153B 地图制作系统、信号处理电路、移动体和地图制作方法 (日本电产株式会社).docx
- CN113711153A 地图制作系统、信号处理电路、移动体和地图制作方法 (日本电产株式会社).docx
- CN113692141A 一种印制电路孔互连结构及其制作方法 (电子科技大学).docx
原创力文档

文档评论(0)