网站大量收购独家精品文档,联系QQ:2885784924

基于双语词典和歧义消解的中英双语专利信息检索研究.doc

基于双语词典和歧义消解的中英双语专利信息检索研究.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于双语词典和歧义消解的中英双语专利信息检索研究.doc

基于双语词典和歧义消解的中英双语专 利信息检索研究 颜端武任婷陶志恒 南京理工大学经济管理学院信息管理系 [目的/意义]为丫增进知识交流、知识共享,避免专利侵权,本文研宄丫基于双 语词典和歧义消解的中英双语专利信息检索方案,并将其应用到实际系统开发 中。[方法/过程]该方案通过基于双语词典的提问式翻译实现双语专利检索,利 用基于潜语义分析的提问式消歧策略进行歧义消解,结合布尔检索模型与向量 空间模型构建检索表达式,与专利索引库进行匹配,生成检索结果。[结果/结论] 选取“3D打印”领域屮英双语专利语料为样本,通过检索实验证明方案的有效 性。 关键词: 专利信息;信总检索;双语词典;歧义消解; 颜端武,男,1976年生,,副教授。 任婷,女,1995年生,生。 陶志恒,男,1992年生,生。 基金:江苏省社会科学基金项目“领域知识分析视角下文献知识关联揭示及应用 研究”(项目编号:17TQB009) Research on Chinese-English Bilingual Patent Information Retrieval Based on Bilingual Dictionary and Disambiguation [Purpose/significance] In order to enhance knowledge communication and knowledge sharing, as well as to avoid patent infringement, this paper studies the Chinese-English bilingual patent information retrieval scheme based on bilingual dictionary and disambiguation, and applies it to develop systems. [Mcthod/proccss] The paper uses the method of query translation based on bilingual dictionary to achieve retrieval, resolves ambiguity based on latent semantic analysis of disambiguation strategy, and combines with boolean retrieval model and vector space model to build retrieval expression. Then the paper matches the patent index database to generate the retrieval results. [Result/conclusion] The Chinese-English bilingual patent corpus in the field of ’’3 D printing77 is chosen as the sample, which proves the effectiveness of the scheme by searching experiment. Keyword: patent information; information retrieval; bilingual dictionary; disambiguation; 研宄外国专利文献,一方面可增进知识交流,了解外国科研成果与技术的发展 动态,避免专利侵权;另一方面可在知识共享的基础上加以创新,进而推动科学 研究和技术创新发展。但是地域语言障碍和专利文献中夹杂的人量专业领域术语, 严重阻碍了人们对外国专利文献的知识获取,而双语信息检索为此提供了一条 有效可行的技术途径。它能使用户由“源语言”检索出“目标语言”信息资源, 在一定程度上帮助和解决跨语言专利资源检索的语言障碍问题与专利挖掘分析 问题,可为跨语言专利资源的获取和利用等提供借鉴和参考。 1双语信息检索相关研宄基础 双语检索主耍利用不同语种间的处理技术构建双语对应关系来匹配源语种和目 标语种,然后进行单语言检索。综合考虑双语检索实现效率和难易程度,提问式 翻译现已成为跨语言检索的主流技术之一。由于提问式翻译检索结果直接受查询 翻译效果的影响,目前的研究集屮于查询翻译方法的研究。 1) 棊于机器翻译的方法。机器翻译包括棊于规则的、棊于统计的方法m,AbU 等m将基于规则的新型机器翻译方法应用于英语一阿拉伯语机器翻译系统中, 较好地解决了一致性和词汇重排列问题,且具备较强的扩展性;何彦青等位1分 别釆用规则翻译和统计翻译来提高双语术语对

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档