基于可比语料库的双语术语抽取的研究述评.pdfVIP

基于可比语料库的双语术语抽取的研究述评.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
184 2009 10 基于可比语料库的双语术语抽取研究述评* 1 1, 2 1 1 ( 100038) 2 ( 2 10094 ) = 对基于平行语料库的双语术语抽取和基于可比语料库的双语术语抽取进行对比分析, 说明基于可比语料 库的双语术语抽取的研究意义与应用价 。分析总结解决该问题的主要方法及其优化方法, 指出存在的问题并 展望该研究的未来发展方向。 = 双语术语抽取 可比语料库 上下文向量 向量相似度计算 = TP391 Survey on B ilin gua l T erm in ology Extr action from C om parab le C orp or a 1 1, 2 1 K ang X ao l Zhang Chengzh W angH u l n 1 ( In st tu te of Sc en t f c T echn cal In form at on of Ch na, Be j ng 100038, Ch na) 2 (D epartmen t o f In format on M anagem en t, N anj ngUn vers ty of Sc en ce Techno logy, N anj ng 2 10094, Ch na) =Ab str act By comp ar ng w th extract ng b l ngual term n ology from parallel corpora, th s paper descr bes th e value of ex2 tract ng b l ngual term no logy from comparab le corpora. It summ ar zes the m a n m ethod and th e opt m zat on m ethod s of mp lemen tat on of b l ngual term nology extract on. And some p ersp ect ves and prospects abou t b l ngual term no logy ex2 tract on based on the comparab le corpus are p roposed. =K eyw or d s B l ngual term nology extract on Comparab le corpora Con text vector V ector sm lar ty compu tat on 1 [1] [ 2] [ 3] 双语术语抽取可应用于双语术语词典编撰 、跨语言信息检索 、机器翻译 等广泛领域。由于国际化的需要, 越来越多的文件采用多种语言的形式在互联网上传播和交流, 多语语料库资源日益增多, 促进了双语术语抽取的研 究和应用。目前, 主要研究方向是在平行语料库上进行双语词语或双语术语的抽取。基于平行语料库的双语术语抽 取具有正确率高的特点, 但由于平行语料库不易获取, 有学者提出利用可比语料进行双语术语抽取的思路。 2 目前, 双语术语的抽取基本上是基于平行语料库进行的。平行语料库( Para llel Corpus) 由源语文本和从源语 [ 4] 文本翻译的译语文本构成 。平行语料可为双语也可以是多语, 还可以是双向等价翻译。例如, 可以由中文文本 及其翻译的英语文本组成, 也可以由中文文本及其翻译的英语、德语、法语、日语等的译语文本组成, 还可以由中 英文双向翻译文本组成。平行语料长期以来在机器翻译研究领域被广泛用于获取词对知识, 构建翻译词典, 以提 收稿日期:

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档