基于可比语料库的双语术语抽取研究评析.pdfVIP

基于可比语料库的双语术语抽取研究评析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《现代图书情报技术》版权所有,欢迎下载引用!  请注明引用地址:基于可比语料库的双语术语抽取研究述评 [J],现代图书情报技术,2009(10):7-13. 总第184期 2009年 第10期 基于可比语料库的双语术语抽取研究述评 1 1,2 1 康小丽  章成志  王惠临 1(中国科学技术信息研究所 北京 100038) 2(南京理工大学信息管理系 南京210094) 【摘要】对基于平行语料库的双语术语抽取和基于可比语料库的双语术语抽取进行对比分析,说明基于可比语料 库的双语术语抽取的研究意义与应用价值。分析总结解决该问题的主要方法及其优化方法,指出存在的问题并 展望该研究的未来发展方向。 【关键词】双语术语抽取 可比语料库 上下文向量 向量相似度计算 【分类号】TP391 SurveyonBilingualTerminologyExtractionfromComparableCorpora 1 1,2 1 KangXiaoli ZhangChengzhi  WangHuilin 1(InstituteofScientific&TechnicalInformationofChina,Beijing100038,China) 2(DepartmentofInformationManagement,NanjingUniversityofScience&Technology,Nanjing210094,China) 【Abstract】Bycomparingwithextractingbilingualterminologyfromparallelcorpora,thispaperdescribesthevalueofex tractingbilingualterminologyfromcomparablecorpora.Itsummarizesthemainmethodandtheoptimizationmethodsof implementationofbilingualterminologyextraction.Andsomeperspectivesandprospectsaboutbilingualterminologyex tractionbasedonthecomparablecorpusareproposed. 【Keywords】Bilingualterminologyextraction Comparablecorpora Contextvector Vectorsimilaritycomputation 1 引 言 [1] [2] [3]   双语术语抽取可应用于双语术语词典编撰 、跨语言信息检索 、机器翻译 等广泛领域。由于国际化的需要, 越来越多的文件采用多种语言的形式在互联网上传播和交流,多语语料库资源日益增多,促进了双语术语抽取的研 究和应用。目前,主要研究方向是在平行语料库上进行双语词语或双语术语的抽取。基于平行语料库的双语术语抽 取具有正确率高的特点,但由于平行语料库不易获取,有学者提出利用可比语料进行双语术语抽取的思路。 2 基于可比语料的双语术语抽取   目前,双语术语的抽取基本上是基于平行语料库进行的。平行语料库(ParallelCorpus)由源语文本和从源语 [4] 文本翻译的译语文本构成 。平行语料可为双语也可以是多语,还可以是双向等价翻译。例如,可以由中文文本 及其翻译的英语文本组成,也可以由中文文本及其翻译的英语、德语、法语、日语等的译语文本组成,还可以由中 英文双向翻译文本组成。平行语料长期以来在机器翻译研究领域被广泛用于获取词对知识,构建翻译词典,以提   收稿日期:2009-09-22   收修改稿日期:2009-09-29    本文系“十一五”国家科技支撑计划重点项目“多语言信息服务环境关键技术研究”(项目编号:2006BAH03B02)、中国博士后科学基金  200801105)和

文档评论(0)

精品教学资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档