中文生物医学文献主题标引中副主题词自动组配机制探讨①.pdfVIP

  • 9
  • 0
  • 约1.13万字
  • 约 7页
  • 2017-09-03 发布于天津
  • 举报

中文生物医学文献主题标引中副主题词自动组配机制探讨①.pdf

中文生物医学文献主题标引中副主题词自动组配机制探讨①

2011年学术年会论文集 中文生物医学文献主题标引中副主题词自动组配机制探讨① 李军莲 李丹亚 孙海霞 李 芳 冀玉静 (中国医学科学院医学信息研究所北京100020) 摘要:简要介绍了-3前国内外副主题词自动组配的研究现状,提出了适用于中文生物医学文献 处理的基于拼图一统计相结合的副主题词自动组配实现方法,详细阐述分析了该混合策略方法的实 现机制及实现效果,并指出后续提高和改进建议。 关键词:副主题词;副主题词组配;主题标引;自动组配 The MechanismofMeSH Automatic Subheading AttachmentforChineseBiomedicalLiterature Abstract:This introducesthecurrentresearchstatusofautomaticMeSH at— paperbneny subheading tachmentbothhomeandabroad.After methodcombined systematic puzzle”一statistical research.a“Jigsaw is issuitablefor withChinesebiomedical reali— approachproposed,which dealing zationmechanismofthis methodis indetailsandthe areevaluated. results integrated analyzed corresponding In to the valueofmain recommen— addition,suggestionsexpectedimprove pair practical heading/subheading dationarefurtherraised. attachment Keywords:subheadings;subheadingattachment;MeSHindexing;automatic 1.引言 副主题词是用于对主题概念进行限定的一类词汇,强调主题概念的某些专指方面。主题标引中, 通过副主题词与主题词组配,不仅可以提高揭示文献的专指性,而且能清晰反映主题概念间的关系, 全面提升检索系统的准确率。 副主题词组配是生物医学文献主题标引中最常见的形式,约90%的文献在标引时应考虑组配合 适的副主题词¨J。2002年,中国医学科学院医学信息研究所研制的中文生物医学文献主题标引系统 投入实际应用后,极大地提高了中国生物医学文献数据库(CBM)入库文献的标引效率和标引质量[2]。 但该系统目前只能推荐游离主题词和副主题词,副主题词组配标引基本采用人工方式进行,很难满足 中文生物医学文献快速增长的需要,是制约主题标引工作效率的瓶颈之一。 国外,美国国立医学图书馆(NLM)一直走在此项研究的前列,其自动标引项目于2007年前后将 副主题词自动组配研究提上13程旧1,阶段研究成果已在其联机标引系统(DCMS)中得到了初步应用。 数据库的发展。 鉴于此,课题组在全面解析N

文档评论(0)

1亿VIP精品文档

相关文档