基于对比学习的低资源语言神经机器翻译数据增强策略 .docx

基于对比学习的低资源语言神经机器翻译数据增强策略 .docx

PAGE2

基于对比学习的低资源语言神经机器翻译数据增强策略

摘要

本文聚焦于人工智能与计算语言学领域中的低资源语言神经机器翻译难题,旨在探讨如何利用对比学习这一自监督学习范式,生成高质量的伪平行语料,以缓解数据稀缺对翻译模型性能的制约。研究遵循“提出问题—分析问题—解决问题”的理论推演路径,系统性地构建了基于对比学习的NMT数据增强理论框架。

论文首先在绪论中阐明了低资源语言NMT面临的核心矛盾——模型性能对大规模平行语料的依赖与低资源语言对数据稀缺的现实。文献综述部分梳理了传统数据增强方法与前沿对比学习技术在机器翻译中的应用,指出现有研究在生成数据的质量可控性与对低资源语言对的针对性

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档