同方知网研院罗思明.pptVIP

  • 8
  • 0
  • 约2.02千字
  • 约 17页
  • 2016-12-09 发布于贵州
  • 举报
同方知网研院罗思明

基于中图分类法的关键词标引研究 同方知网研究院 罗思明 2010.05.22 Contents 问题提出 同方知网技术有限公司(CNKI),是国内著名的电子学术文献出版商。提供了国内最全的库中文期刊、报纸、博硕士论文等全文数据,为中国的学术研究与科学发展提供了优良的海量学术文献资源。 为满足用户的文献检索需求,我们需要为学术文献标注各种信息。例如:需要对文献进行中图分类,为文献提供关键词、主题词、摘要等信息,便于用户检索。 问题提出 关键词定义:指文章中最能反映文献主题信息的特征词汇、词组或短语。 目前问题: (1)很多文献(报纸)没有关键词,人工标引分类号存在主观性强的问题,且费时费力。 (2)由于很多人对关键词的作用和意义认识不足,即使是作者亲自标引的关键词,也存在着许多问题。 任务:为CNKI学术文献自动标引关键词。 解决思路 传统方法: 以往的关键词标引方法多采用TF/IDF特征以及词语长度、位置等特征,本文设想加入语义信息,提高关键词标引正确率。 中图分类法: 《中国图书馆分类法》是国内学术文献通用的分类体系,中图分类法是一个完整的知识分类体系。中图分类号(分类号)在一定程度上反映了文献的主题语义信息。 解决思路 关键词与分类号的作用: 关键词和分类号在某种程度上作用一致,他们都表现了文献的主题。因此可以建立词语与分类号的联系,计

文档评论(0)

1亿VIP精品文档

相关文档