- 3
- 0
- 约7.74万字
- 约 67页
- 2018-01-28 发布于天津
- 举报
Web双语平行语料自动获取及其在统计机器翻译中的应用.PDF
Web双语平行语料自动获取及其在统计机
器翻译中的应用
学生:林政
导师:马希荣
专业:计算机应用技术
学号
1
摘要
摘 要
双语平行语料库在自然语言处理领域有很多重要应用,它为统计机器翻
译模型提供不可或缺的训练数据,同时也是词典编纂和跨语言信息检索等应
用的重要基础资源。但是大规模双语平行语料库的获取并不容易,现有的平
行语料库在规模、时效性和领域的平衡性等方面还不能满足处理真实文本的
实际需要。随着互联网的普及和飞速发展,越来越多的双语网站被创建,越
来越多的信息以多语言的形式发布,这就为双语和多语语料库的建设提供了
很大的来源。一些研究者提出了基于Web 的双语或多语平行语料库自动挖掘
方法,为双语或多语平行语料库的自动构建提出了有效的解决途
原创力文档

文档评论(0)