基于统计的知识组织系统自动映射方法研究-数字图书馆论坛.PDFVIP

  • 1
  • 0
  • 约1.24万字
  • 约 4页
  • 2019-08-18 发布于北京
  • 举报

基于统计的知识组织系统自动映射方法研究-数字图书馆论坛.PDF

基于统计的知识组织系统自动映射方法研究-数字图书馆论坛.PDF

理论研究 http: // 基于统计的知识组织系统自动映射方法研究 □ 刘晓鹏 真溱 于洋 / 中国国防科技信息中心 北京 100142 摘要:文章在分析知识组织系统自动映射方法的基础上,提出了利用标引记录库中的关键词来自 动构建统一知识组织系统的新思路,给出了具体的方法步骤以及所需采用的数学模型。 关键词:统一知识组织系统,自动构建,词表互操作,主题词表映射,分类表映射,关键词 DOI:10.3772/j.issn.1673—2286.2009.12.013 1 引言 使用统一的索引和检索引擎,创建 资源集成,就是在语义层面实现不 索引并提供检索服务;其后出现了 同知识组织系统概念之间的转换, 随着互联网技术的普及,越来 多种依托代理 (Agent )和 自动采 使用户在掌握一种知识组织系统的 越多的用户开始进行跨多个数据库 集等技术手段的信息集成方式,如 情况下,能够 自动转换到与之相关 的信息检索。但由于各个数据库收 元搜索模式、联邦检索模式、基 的其它系统,提高计算机 “理解” 集信息的范围和原则各不相同,某 于开放资源互操作协议OAI (Open 用户提问的能力,使用户能够在检 一主题的相关信息往往分散在不同 Archive Initiative)的收割集成模式[2] 索过程中克服知识组织系统的差异 数据库中,信息资源集成服务的重 以及在Web 2.0技术框架下的信息聚 性和相关文献的分散性所带来的问 [3] 要性因此凸现出来。目前主要有两 合 (RSS)集成模式 等。 题,提高检索的查全率和查准率。 种层面的信息资源集成模式: 1.2 知识组织系统层面 1.3 两种集成方式的比 1.1 元数据层面的信息 的信息资源集成 较及本文的研究目的 资源集成 知识组织系统是各种对人类 元数据方式主要针对信息资源 元数据层面的资源集成方式 知识结构进行表达和有组织的阐 在存储上的分散性、在数据库以及 (下简称 “元数据方式”)主要通 述的语义工具 (Semantic Tools ) 元数据结构上的异构性,解决语法 过对物理上异地分布的、异构的信 的统称,包括传统图书情报机构 信息层次上的信息资源集成问题, 息资源实施集成,将它们的物理分 建立在 文献 单元基础 上 的分类 存在一定的局限性。具体来讲,由 散性和异构性屏蔽起来,向用户提 表、标题表、叙词表 以及更泛指 于不同的信息资源库可能使用不同 供一致的数据界面和高效、简便的 的情报检索语言、标引语言 (又 的主题词表、分类表等知识组织系 [1] 查询服务 。用户只提交一个检索 称索引语言),也包括新的建立 统,因此同一概念在不同的信息资 提问,就能够同时获得多个信息资 在概念单元或知识单元基础上的 源库之中可能采用不同的概念表达 源库的检索结果。最早期的元数据 概念地图 (Concept Map ) 、语义 方式,使得用户在检索相同学科或 集成方式是通过大量的、有组织 网络 (Semantic Network )、本体 主题时,

文档评论(0)

1亿VIP精品文档

相关文档