中文生物医学关键词-主题词映射表计算机辅助构建与维护机制研究.pdfVIP

中文生物医学关键词-主题词映射表计算机辅助构建与维护机制研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文生物医学关键词-主题词映射表计算机辅助构建与维护机制研究.pdf

· 本期话题 · 中文生物医学关键词.主题词映射表计算机 辅助构建与维护机制研究术 孙海霞 。,吴英杰 ,李丹亚 ,李军莲 (1.中国医学科学院医学信息研究所,北京 100020;2.南京大学信息管理学院,南京 210093) 摘要:将自然语富应用到信息组织、标引、检索和分析所需的各种词表中,实现自然语言与受控语言闻的互 操作,是新一代知识组织系统构建模式。文章围绕 “关键词识别与扩充、关键词4-题词映射关系构建、关键 词主题词映射关系更新”3个方面,介绍了中文生物医学关键词-主题词映射表的计算机辅助构建:与维护机制, 以及系统的功能架构。 关键词:生物医学;关键词吐题词映射;知识组织系统;词表更新;计算机辅助 中图分类号:G350 DoI:10.3772~,issn.1673—-2286.2014.12.003 自然语言检索己成为信息检索的必然趋势之一,但 工具 ,~HMicroMeSH、Chartline、Clarit、Saphire及 长期以来,为实现信息的有效组织与利用,在信息检索 MetaMap,并且这些工具已在词表的自动更新与维护、 领域,广泛用于文献资源的标引、组织和检索的是受控 信息组织、处理与利用等各个领域实践中得到不同程 语言,如主题词表、叙词表、分类表等。在此背景下,无 度应用 。在国内,中国医学科学院医学信息研究所 论是在情报检索语言理论研究,还是实际知识组织系 也己在九十年代开始基于中文医学主题词表CMeSH 统的编制研究,学者们开始探索新一代的知识组织系 (ChineseMedicalSubjectHeading)郇编制中文生物 统构建模式 】【。】,主张人工语言与自然语言相结合,将 自 医学关键词一主题词映射表,并在中国生物医学文献 然语言应用到情报检索所需的各种词表中,实现 自然 “自然语言一主题语言一分类语言”一体化计算机辅助 语言与受控语言问的互操作。如南京农业大学侯汉清 标引系统中得以应用,很大程度上提升了中文生物医学 及其博士生、硕士生先后持续开展的自然语言叙词表构 文献组织、标引和检索系统性能nj。 建、情报检索语言的兼容转换、面向信息检索的汉语同 但随着中文生物医学文献的飞速增长、新领域的 义词自动识别等系列研究[4墙]。 不断兴起与发展,中文生物医学关键词一主题词映射 在生物 医学信息领域,为实现领域 自然语言与规 表因编制效率低,开始面临内容更新缓慢、无法及时揭 范语言的结合,国内外医学信息工作者们开展了系列 示新兴研究成果和满足中文生物医学文献组织、自动 研究。在 国外,美国国立医学图书馆一直走在前列, 标引需求的挑战,进而在一定程度影响了中文医学文献 他们先后开发出了一些映射 自由文本到领域权威词表 检索系统的性能。就其问题和原因所在,可主要归纳为 MeSH(MedicalSubjectHeading)或UMLS(Unified 两点:(1)映射表中关键词文献覆盖率不高;(2)关键 MedicalLanguageSystem)的自由文本与概念映射 词和主题词映射关系的建立还主要靠人工进行,缺乏 本研究得到中国医学科学院医学信息研究所基本科研业务专项 “中国生物医学文献服务系统发展关键问题研究” (编号:13R0103)资助。 16 2014年第12期 (总第127期) 孙海霞,吴英杰,李丹亚,等 中文生物医学关键词一主题词映射表计算机辅助构建与维护机制研究 计算辅助映射支持。 2映射表计算机辅助构建与维护技术路线 1CMeSH和中文生物医学关键词一主题 如图1所示,映射表 的计算机辅助构建与维护整 词映射表 体可分为三个步骤:词源扩充、映射关系自动构建与更 新、人工审

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档