迈创嵌入式口语机器翻译系统的研制.doc

迈创嵌入式口语机器翻译系统的研制.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
孙建军,男,1964年生人,博士学位,高级工程师,主要研究方向为自然语言信息处理,机器翻译。 迈创嵌入式口语机器翻译系统的研制 孙建军 (北京迈创易达科技发展有限责任公司 北京 100044) 摘 要:本文论述了嵌入式口语机器翻译系统(以下简称“口语翻译系统”)的开发背景和必要性,同时针对口语翻译系统应用的实际情况说明系统在开发过程中需要解决的一些问题,并从关键技术创新的角度阐述了迈创嵌入式口语机器翻译系统(以下简称“迈创口语系统”)的技术特点。该系统采用一个翻译引擎来实现英语和汉语的互译。系统的双语句子调试将近有20余万条,从而使系统的语言翻译质量得到了改善。 The Development of Multran Embedded Spoken Machine Translation System Sun Jianjun (Beijing Multran Technology Corp. Beijing 100044) Abstract: In this paper, firstly, we have reviewed the background and necessity of developing the Embedded Spoken MT System. Then, from the point of the application of spoken system, we discussed the problem in the spoken MT system development. Finally, we introduce the Multran Spoken Translation System, which utilizes one translating engine to translate English to/from Chinese. In order to improve the system quality, we have debugged about 200 thousands English and Chinese sentences. 一、口语翻译系统的开发背景和必要性      实现机器翻译系统的广泛应用一直是机器翻译系统研制开发的最终目的。围绕这一目标,人们进行了不断的研究和探索。但语言信息处理系统的复杂性以及人类对大脑智能机制了解的欠缺,使得人们在利用现有机器翻译技术开发实用性机器翻译系统方面遇到了很大的困难。一些基于大而全方式开发的机器翻译系统长期以来一直在如何提高系统语言翻译质量问题上徘徊不前,从而成为妨碍机器翻译系统应用的主要障碍。因此,如何在目前状况下,在一些受限语言信息领域上快速、实效地开发系统实现效率高,翻译质量好,应用范围广的机器翻译系统就成为人们寻求机器翻译系统应用的一个重要突破口。    口语言信息表达作为人们日常交流的一种主要沟通方式,语言表达的简洁性和使用范围的广泛性越来越受到人们的重视。开发基于口语言信息内容处理的机器翻译系统,在便于使用和携带的嵌入式系统平台上应用也就成为了人们开发实用性机器翻译系统的一个重要内容。一方面,口语言表达涉及语言词汇少,语言结构表达简单,这就为降低语言信息处理系统开发的复杂程度,提高系统的语言翻译质量提供了保障;另一方面,口语言信息表达的内 容以沟通交流为目的,涉及人们的衣、食、住、行等多个方面,从而为系统的广泛应用创造了条件。      此外,随着计算机技术的不断发展,嵌入式系统的应用也越来越普及。以手机、电子词典、掌上电脑等为代表的手持型电子消费产品在人们日常生活中的使用也越来越广泛。这无疑为口语翻译系统的广泛应用奠定了基础。尤其是北京2008年奥运会的举办,上海2010年世博会的召开都会给口语翻译系统的应用带来广阔的市场前景。可以说,在不远的将来,口语翻译系统的开发和应用会形成一种发展的必然趋势。    二、口语翻译系统研发中需要解决的一些问题      基于口语言信息内容处理,能够在嵌入式平台上应用是口语翻译系统具有的主要特点。虽然口语言信息结构表达简单,有利于提高系统的开发效率,但口语言信息表达的多样性和口语词汇的多歧义性也会给口语翻译系统的语料收集和语句调试带来一定的困难,直接影响到系统的语言翻译质量。另外,嵌入式平台系统所具有的内存运行空间小、运行速度慢以及系统平台多样化特点也对口语翻译系统开发的系统结构建造和系统的移植能力提出了挑战。因此要解决好这些问题,我们就必须在机器翻译技术使用、口语语料收集和语句调试以及系统的移植应用等方面做出适当的选择。      首先在机器翻译技术的选择方面,基于语言规则和基于语言实例的机器翻译技术是目前机器翻译系统研发过程中主要采用的两种技术。它们在应用中各

文档评论(0)

yanmei113 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档