基于机器翻译语块的命名实体翻译方法研究.pdfVIP

基于机器翻译语块的命名实体翻译方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于机器翻译语块的命名实体翻译方法研究.pdf

2O15年第3期总第171期 S¨L●C0N VALLEY 基于机器翻译语块的命名实体翻译方法研究 马国来 ’,尹长青 ’。宋善威 (1同济大学软件学院 ,上海 201804;2.同济大学设计创意学院 ,上海 201804) 摘 要 命名实体翻译旨在实现命名实体在不同语言之间的转换与对应。现有翻译模型存在技术不成熟及缺乏互相结 合的问题。对此 ,提出了基于语块的机构名翻译及与基于机器学习策略的音译模型相结合的方法。前者解决了统计模 型在组织机构名翻译中存在词语选择 ,词语调序等困难的问题。后者保证有效地检索到存在翻译结果的页面 ,以及解 决 了正确翻译结果抽取的问题。 关键词 人工智能;机器翻译 ;命名实体翻译 中图分类号 :TP391 文献标识码 :A 文章编号 :1671—7597(2015)03—0209一O2 在跨语言机器翻译等 自然语言处理应用中 ,需要翻译大量 的构成格式一定 ,通常包括地域或者范围修饰词、序数修饰词、 命名实体。命名实体翻译旨在实现命名实体在不同语言之间的 通用修饰词、代表领域或功能的修饰词和关键词等。而且地域 转换与对应 ,它是跨语言信息处理领域的一项重要任务 。命名 或范围修饰词和关键词在语料中的重复率比较高 ,而其他修饰 实体是语言中承载信息 ,表达语义的重要单位 ,找到不 同语言 词重复的比例 比较少 。组织机构名中的企业机构名翻译过程中 信息资源 中命名实体 的翻译对应关系 ,是进行跨语言信息综合 语序需要调整的比例 比较少 ,重点在于企业机构名中的音译实 应用的基础 。 体的翻译 ,该部分翻译问题可以依靠前面的研究的音译方法解 不同类别的命名实体有不同的构成方式和翻译规律 ,在某 决。而其中的行政管理机构名翻译过程语序调整 比较多 ,进一 些方面存在 巨大的差异。命名实体翻译不仅仅要解决普通机器 步研究发现行政机构名翻译对 中词汇对齐是 以语块为单位 的, 翻译固有的问题 ,如词语选择、词语调序 ,还需要解决音译问 而调序也是与语块与语块之间的调序 ,块 内调序比较少 。 题 以及音译和意译相结合的问题 ,因此命名实体翻译仍然是一 由此 ,本研究尝试采用以语块为翻译单位建立翻译模型 , 个 自然语言处理问题中一个难点 ,存在很大的挑战性。 其中重点解决候选语块的抽取及概率计算及基于上下文无关的 主要存在的问题如下 : 翻译解码算法。 1)尚未有对音译模型的输 出结果修正方法进行研究 ,修正 1.2 基于机器学习策略的音译模型 其部分翻译正确的情况以提高音译模型的最终性能。 本文尝试采用机器学习策略解决音译模型解决音译 问题。 2)针对命名实体整体的翻译模型研究还不成熟 ,对音译与 通过对现有音译实体的结构和翻译特征研究 ,发现结果为音译 意译想结合的翻译研究比较少。 翻译与机器翻译不 同。首先音译不需要词语之间的序列调整 , 3)基于机器学习策略的音译模型和基于本地翻译模型方法 其次音译过程中发音辅音起到很大作用 ,相应不发音的元音并 分开研究 ,没有考虑将翻译结果和音译相结合的翻译抽取 ,将 不起作用。本文对音译对齐结果进行适当的转换 ,转化为序列 翻译结果 中的有效信息作为查询扩展有效提高获取网络资源的

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档