- 3
- 0
- 约1.57千字
- 约 13页
- 2019-12-29 发布于天津
- 举报
民文机器翻译所面临的瓶颈问
题-资源与技术
那顺乌日图
一、简要的回顾
民文机器翻译研究,从严格意义上来讲,
始于上世纪九十年代末。虽然从80年代开始在
国内外曾有人提出或试图做民文机器翻译研
究,但当时由于理论、技术上的条件都不成
熟,从而一直没有得到实施。到九十年代后
期,民文信息处理工作经过近二十年的探索,
基本上走过了字处理阶段。这样,人们在搞基
础理论研究的同时开展应用系统的开发。其中
机器翻译大概是除了电子出版以外的另一个热
点。
• 青海师范大学是进行汉藏机器翻译较早的
单位,他们在国家863计划资助下开发汉藏
翻译系统及电子词典,引起学界和用户的
广泛关注,其开发的汉藏(藏汉)在线翻
译和智能化汉藏(藏汉)翻译系统都得到
广泛应用;
1998年内蒙古大学蒙古学学院、中国科学院计算技
术研究所、北京大学计算语言学研究所共同承担国
家863项目“面向政府文献的汉蒙机器辅助翻译系统
” ,研制出“达日罕系统-政府文献版V1.0” ,此后上
述三个单位又承担一期863项目对该系统进行改进
;
2009年新疆大学与新疆信息产业有限公司合
作在工信部电子信息产业发展项目的资助下
开展了汉-维、柯辅助翻译软件的研发;
2010年中科院计算所与新疆大学合作推出了
基于统计的维汉机器翻译系统;
2011年中科院新疆理化所也推出了汉维/ 维
汉统计机器翻译原型系统;
据不完全统计,目前进行民文机器翻译的
除了上述几个单位之外至少还有:
中科院计算所(汉-蒙、藏、维,蒙、藏、维-汉)
中科院智能所(汉-蒙、?)
西北民族大学 (藏-汉、?)
中科院自动化所(藏、(新/老)维、蒙-汉)
清华大学 (蒙、藏、维-汉)
哈尔滨工业大学(汉-维、?)
北京理工大学 (?)
内蒙古师范大学(蒙-汉)
…… ?
2009年CWMT首次将汉蒙机器翻译列入测试
范围,7个单位的翻译系统参加测试,2011年
CWMT又将测试语言范围扩展到藏、维等语
言和蒙汉机器翻译。
建立面向少数民族地区和周边国家的
双语或多语网站,开发少数民族语言文
字多媒体教学系统等,都将需要民族语
言机器翻译系统。
但是目前大多系统的水平,尚未达到
能够很好地满足用户要求的、产品化的
程度。
• 蒙古国相关大学和研究机构也在开发英
蒙,蒙英……等。
• 日本諏訪東京理科大学等也在开发日-蒙机
器翻译系统。
• 在国外开发藏文、维文系统的也不乏其
人……
• 那么民文机器翻译系统发展缓慢的主要瓶
颈在哪里?
• 这个问题还得与机器翻译技术本身的发展
结合起来考虑:
90年代基于规则的机器翻译技术比较盛行的
时候,民文翻译的效果还算可以,因为当
时基于规则的系统准确率基本上都不高;
• 2000年后基于实例的机器翻译开始盛行的
时候,民文机器翻译的发展速度就受到了
制约,那是因为没有一个令人满意的,哪
怕是满足基本需求的实例库都很少;
• 近几年基于统计的机器翻译作为机器翻译
主流技术的时候民文机器翻译同样发展缓
慢,主要瓶颈还是资源匮乏。
如何解决资源问题?
建立资源联盟?
申请专项?
还请大家多加关注。
谢谢!
原创力文档

文档评论(0)