跨语言信息检索及其相关问题.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014年 1 月 教 育 教 学 论 坛 dar1.2O14 第 1期 EDUCATION TEACHING FORUH N0.1 跨语言信息检索及其相关问题 张彦文 (桂林电子科技大学 图书馆,广西 桂林 541004) 摘要:网络信息技术的飞速发展产生了丰富的海量信息资源。信息资源所采用语言的多样性和用户所掌握语言的差 异性,带来了信息检索的多语言或跨语言困难。跨语言信息检索是为了适应这一发展要求而诞生的信息检索检索方法和 技术。本文对跨语言信息检索的渊源、跨语言信息检索方法以及跨语言信息检索模型等进行了讨论。 关键词 :信息检索;跨语言检索;检索模型;多语言信息资源 中图分类号:G2 文献标志码:A 文章编号:1674—9324(2014)01—0132—03 信息技术的发展产生了大量的数字信息,人们进入了 术,信息检索模型则是实现查询和信息资源匹配的重要理 海量信息资源和大数据时代。特别是互联网技术的快速发 论基础。本文对此都进行了讨论,以利于图书馆员们更好地 展,因特网上的信息资源类型和数量愈来愈丰富,所使用的 了解和掌握跨语言信息检索相关技术。 语言愈来愈具有多样性。网络资源语言的多样性和网络用 一 、 跨语言信息检索方法 户所掌握语言的差异性不可避免地给人们利用网络检索信 跨语言信息检索一般可以分为如下三个过程:①多语 息带来了语言障碍。这种语言障碍极大地限制了人们对信 言信息资源的搜集以及多语言信息索引的建立;②应用语 息资源的有效获取,跨语言信息检索由此应运而生。跨语言 言 自动处理技术实现提问语言(源语言)和信息资源表述语 信息检索由康奈尔大学的Salton于20世纪70年代初首先提 言(目标语言)的统一;③应用单语言信息检索技术实现查 出。他利用手工编制的英语一德语双语种词表,进行了跨语 询提问式与索引信息的匹配,得到检索结果。其中源语言和 言信息检索的尝试;1973年,他又编制了英语一法语词表, 目标语言的统一是实现跨语言信息检索的关键技术,主要 并对跨语言信息检索的效率进行了评价。1964年,法国道路 通过提问式翻译、文献翻译、中间语种转换及非翻译方法等 研究实验室开发了 “国际道路研究文献系统”,该系统通过 四种方式来实现。提问式翻译是指将用户提交的查询请求 英、法、德三种语言索引词构成的多语言受控词表来实现跨 翻译成系统支持的多种语言,然后对不同语言的信息集进 语言信息检索。跨语言信息检索是指用户以自己熟悉的一 行查询。提问式翻译主要有字典和语料库两种方法。其核心 种语言来构建和提交查询提问式,从多语言信息资源系统 思想在于通过语料库中不同语种同一信息的对应关系对提 中检索出符合用户需求的另一种或多种语言描述的相关信 问式进行翻译并且过滤提问式翻译后产生的非正常翻译结 息资源。例如,输人中文的提问式,从多语言信息资源系统 果。提问式翻译是实现跨语言信息检索较为经济的方法。其 检索出英文、法文或中文及其他语言描述的相关信息资源。 缺陷在于,系统返回的信息仍然用 目标语言表达,只能算一 用户查询提问时所使用的语言称之为源语言,而系统检索 种不完全的跨语言信息检索。文献翻译是指在信息检索之 出的信息资源所包含的语言称之为 目标语言。跨语言信息 前,将文献信息资源表述的目标语言转化为查询提问式的 检索,可分为双语言信息检索和多语言信息检索。双语言信 源语言。目前实现文献翻译的方法主要有机器翻译和基于 息检索是指用户以自己熟悉的语言提交查询请求,除源语 字典翻译文献索引词方法。文献翻译的优点是检索

文档评论(0)

文档集锦 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档