口语自动翻译系统技术评析ξ.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
口语自动翻译系统技术评析ξ

中 文  信  息  学  报 第 13 卷 第 2 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 13 No. 2 口语自动翻译系统技术评析 宗成庆  黄泰翼  徐 波 中科院自动化研究所  模式识别国家重点实验室  北京  100080 摘要  近几年来 ,随着信息技术的发展 , 口语自动翻译技术成为新的研究热点 。目前国际 上一些著名大学和研究机构甚至企业 ,都纷纷加入这一高技术的竞争行列 ,我国在相关技术方 面也进行了卓有成效的研究 。本文对 目前自动口语翻译研究的技术现状进行了全面综述和分 析 ,并对一些具体问题作了深入探讨 。作者希望本文作出的分析和讨论的问题 ,能够对我国的 自动口语翻译研究提供有益的参考 。 关键词  口语翻译  语音翻译  对话处理  机器翻译  鲁棒性 一 、引言 自80 年代末期 ,人们开始致力于语音翻译的研究 , 由于该项研究不仅具有重要的科学意 义 ,而且蕴涵着潜在的巨大社会和经济效益 ,因此 ,许多发达国家竞相投入经费开展全国性或 多国性的联合攻关 ,美国的CMU 、日本的A TR - I TL 、德国联邦政府教育、科学 、研究与技术部 (BMB F) 和 Siemens 等世界著名大学 、研究机构和企业都是自动语音翻译研究的重要的开拓者 或参与者 。为了进一步推动自动语音翻译研究的更快发展 , 199 1 年一些国际知名研究机构 、 大学和企业联合成立了国际口语翻译组织 C - STA R ( Consortium for Speech Translation Ad vanced Research) ,到目前为止 ,该组织已经发展成为 C - STA R II 并拥有包括中国科学院自动 化研究所 、声学研究所和哈尔滨工业大学在内的二十多个会员 ,其研究目标是形成特定领域的 口语对话翻译系统 ,最终实现基于自动翻译的全球自由通讯 。 然而 , 由于自动语音翻译技术涉及语言学 、声学 、信号处理 、模式识别和认知心理学 、计算 机科学等各种学科的知识和技术 , 同时集语音识别 、机器翻译和语音合成等理论难点和技术难 关于一身 ,使得其研究历程步履维艰 ,语音翻译被认为是对现代科技重要的挑战之一 。 本文将对 自动语音翻译研究的现状 、技术特点及其存在的问题等 ,进行全面综述和分析 , 作者希望本文提出的问题及所作的分析能对 自动语音翻译研究提供有益的参考 。 二 、口语翻译技术特点 从原理上讲 ,一个单向的语音翻译系统主要由语音识别 、机器翻译和语音合成三个模块构 成 ,如图 1 所示 。 本课题得到国家自然科学基金资助 ( ) ( ) 和国家 863 高技术项 目资助 863 - 306 - ZT03 - 02 - 2 本文 1998 年 7 月 28 日收到 56 图 1  语音翻译系统组成原理 由于人们的日常交谈大多数是在情景对话中进行的 ,因此 ,针对情景对话的口语翻译比规 范语言的语音翻译有更广泛的应用前景 , 目前的语音翻译系统基本上都是针对 口语对话的。 口语自动翻译与文本机器翻译相比,有许多自身的特点 ,主要表现在如下几个方面 : ( ) 1 在语言的规范性方面 , 口语句子含有大量的不规范语言现象 ,包括句子间长时间的停 ( ) 顿 、重复 、省略、修正和犹豫 嗯 ,哦 ,um , hmm 等 ,汉语中大量同音字和词的存在以及语音识 别技术的限制 ,使得单词识别本身难以达到 100 %的正确 , 因此 ,与文本机器翻译不同 , 口语翻 译系统

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档