基于形态信息的汉蒙翻译模型和语言模型构造方法研究.ppt
中国科学院西安光机所2000年度工作总结 基于形态信息的汉蒙翻译模型和语言模型构造方法研究 一、存在的问题及解决方案 1. 汉蒙统计机器翻译中存在的问题 (1)数据稀疏问题比较严重。 (2)译文结果在词形变化方面产生的错误比较明显和突出。 一、存在的问题及解决方案 (1)由于语料库缺乏,导致了数据稀疏问题。统计机器翻译的基础是语料库。相比于汉英等已经具有比较长的研究时间的方向,汉蒙语料比较稀缺。目前的几万条的实验资源是远远不能满足当前统计机器翻译的需要的。 一、存在的问题及解决方案 (2)由于蒙古语具有黏着特性,与汉语相比,形态变化非常丰富且复杂,一个词干之后可以层层缀接不同的构形词缀构成不同的词形。因此,译文结果容易在词形变化方面产生错误。 一、存在的问题及解决方案 词形变化引起的错误主要集中表现在以下两点: 1)蒙古语动词(除了一些没有词形变化的特殊动词,如ALAG_A,BVI)在句子环境中都会发生词形变化,以表现式、态、体等的信息,而统计机器翻译结果并不总能正确表现蒙古语动词的形态变化;例如,在不考虑蒙古语构形词缀信息的情况下,统计机器翻译结果中会出现如下错误: BI(我)MARGASI(明天)BEJING-DU(北京)0CIBA(去)。 一、存在的问题及解决方案 2)蒙古语译文中体词变形的错误,如格附加成分的缺乏、冗余以及名词复数形式无变形等。 例
您可能关注的文档
- 因地制宜 优势互补 共创繁荣.ppt
- 团体成住坏灭的宿命——汤恩比.ppt
- 团结力量大.ppt
- 团队凝聚力培训PPT模板.ppt
- 团隊形成Team Structure and Leadership.ppt
- 围成圆的曲线的长叫做圆的周长.ppt
- 围手术期高血压诊断和治疗.ppt
- 围术期容量治疗.ppt
- 固定偏压CE放大电路分析.ppt
- 国债预发行交易结算业务介绍.ppt
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- 2026年120指挥中心联动计划.docx VIP
- 5.3细胞的呼吸作用和原理课件高一上学期生物人教版必修1.pptx
- 电力可靠性管理员职业技能鉴定初级考试题(附答案).doc VIP
- 01A人教版新起点一年级上册单词表衡水体字帖(一起点).pdf VIP
- 2026国家广播电视总局直属事业单位招聘166人备考题库及参考答案详解.docx VIP
- 2026广西交通实业有限公司加油员招聘25人考试重点题库附答案解析.docx VIP
- 2025年山西省【中考数学】试卷(空白卷含解析).pdf VIP
- 浮力---液面升降专题.pdf VIP
- 标准监理招标文件(2017版).pdf VIP
- 小学五年级英语期中试卷5.doc VIP
原创力文档

文档评论(0)