面向口语翻译汉语语句改写方法1.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Journal of Chinese Language and Computing 12(1)63-77 63 面向口语翻译的汉语语句改写方法1 宗成庆+ * 张玉洁*2 山本和英* 坂本仁* 白井谕* + 中国科学院自动化研究所模式识别国家重点实验室 北京 100080, 2728 信箱 cqzong@ * 日本ATR 音声言语通信研究所,619-0288 京都府 {yujie.zhang, kazuhide.yamamoto, masashi.sakamoto, satoshi.shirai}@atr.co.jp 摘要:在口语自动翻译系统中,当翻译引擎无法对输入语句(utterance) 进行正确理 解和翻译时,如果系统能够自动提供输入语句其它可能的表达方式,无疑将提高系 统翻译的正确率。本文介绍汉语口语为源语言输入的汉- 外口语自动翻译系统中,汉 语口语语句自动改写方法研究的基本思想和初步成果。本文中作者提出了基于口语 解析技术和语言自动生成技术相结合的汉语口语自动改写方法。该方法的基本思想 是,首先利用口语自动解析技术提取输入语句的主要特征,包括语句类型,时态, 句法成分等,并对复杂长句进行自动识别和切分,然后,根据解析结果利用语言生 成技术实现输入语句的自动改写。 关键字:语句改写,口语自动翻译,口语解析 1. 问题背景 由于自然口语本身的灵活性和多变性,以及语音识别器可能产生错误的识别结 果和一些基本口语信息(如停顿、语气等)丢失等因素,使得口语语音自动翻译研 究面临许多困难[18]。在过去十几年的口语自动翻译研究中,人们提出了很多方法来 提高自然口语解析器的鲁棒性(robustness)和翻译正确率[2,10],然而,目前的口语自 动翻译技术仍然面临许多问题,如何处理复杂的口语句子,正确翻译和表达说话者 的意图,仍然是目前口语翻译研究中需要解决的关键问题之一。 1 本论文的研究工作得到中国国家自然科学基金资助(项目编号, 和国家973 项目资助(项目编号:G1998030504-01)。 2 目前该作者的工作单位为:日本通信综合研究所 (CRL) ,通讯地址不变,新的e- mail 地址为:yujie@crl.go.jp 。 64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai 在研究口语翻译策略时,一种基本的思想是借鉴和模拟人在进行口语翻译时的 基本模式。当说话者说出一句话的时候,充当翻译的人如果不能理解说话者的意 图,那么,翻译需要询问说话者,在这种情况下说话者很可能会给出不同于原来句 子的另外一种表达形式,要么替换刚才说出的话中比较生僻的词语,要么变换句子 结构或者进行意思解释。这个过程实际上是由说话者自己完成了一个句子改写 (说)的过程。这样,我们很自然地想到,如果在口语翻译系统中,当翻译引擎不 能实现输入句子的正确翻译时,如果系统的源语言预处理模块能够自己实现输入句 子的自动改写,并不断为翻译引擎提供原来语句另外可能的表达形式,对于提高翻 译系统的鲁帮性和正确率无疑是十分有意义的。从另一个角度来讲,由于翻译模块 能够处理的语言现象往往是有限的,如果系统源语言预处理模块能够生成输入语句 的其它多种表达形式,那么这些表达式中只要有一个落入到系统可以处理的有限的 句型集之内,系统就可以得到原输入输入语句的正确翻译结果。因此,基于这种考 虑,日本ATR-SLT (Advanced Telcom- munications Research Institute 识别结果 翻译结果 International, Spoken Language 翻译模块 Translation Laboratories) 的 Yamamoto 语 改

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档