数字资源知识组织功能中叙词表应进行的变革.pdfVIP

数字资源知识组织功能中叙词表应进行的变革.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目tfif根工作,, 图书馆数字信息资源建设与知识组织 华北地区 数字资源知识组织功能中叙词表应进行的变革1 常春 (中国科学技术信息研究所北京100038) 摘要文章从叙词表的编制和应用两个方面讨论了数字资源知识组织中叙词表应该进行的变革.在编制方面, 叙词表的概念术语可以来自高频的专业论文关键词,或者网络资源中用户使用的自由词,同时努力增加等同关系 的术语.在获取词闻关系时,可以采取统计共现率.使用用户组合检索日志,使用网络文献库日志等获取词间关 系,文章最后展望了叙词表的应用领域. 关键词叙词表词间关系信息组织 诞生于20世纪50年代的叙词表,在我国到20世纪80年代发展到顶峰时期,表现为大规模的叙词表编制和 应用…,相关国家标准的出台豫”,情报语言学科的建立等各个方面的成就Ⅲ.这时的叙词表特点是编制周期长、 编制需要领域专家参与、主要用户是图书情报机构的专业检索人员、应用领域主要是期刊或书目单机或联机数据 库信息检索。到20世纪90年代以后,随着因特网的普及和网络信息的指数增加,传统图书馆正在向复合图书馆、 数字图书馆转变,随着网络功能和技术的发展,图书馆的多数功能直接通过网络得以实现。读者足不出户,通过 因特网几乎可以得到任何个人或组织需要的信息或知识。这时的用户,从信息分类、信息检索等多个方面,实现 了信息获取的自主性和智能化悔1.网络信息资源的信息组织和信息检索主要是计算机科学领域独立发展起来的自 由词索引和检索,关键词是自然语言,不同的用户使用的关键词不同,检索结果就可能不同,所以,使用叙词表 进行标引和检索,显示出信息查全和查准的优势,可标引工作增加了信息加工的成本,不同标引人员对叙词表的 使用有可能存在误差,最重要的足用户不熟悉叙词表的使用,造成了叙词表在信息检索中的强大功能没有得到完 全的体现。随着数字资源以指数形式增加,自由词检索在查全和查准方面存在的问题越来越严重,图书情报工作 者又开始关注叙词表可否在网络信息组织和信息检索过程中发挥作用,或者说传统的叙词表应该作哪些变革才能 在海量数字信息资源组织和检索中体现优势,在网络信息时代再次发挥重要作用。本文就是其中的一些重要探索。 1叙词表概念术语的选择 普通用户一般使用关键词或自由词检索信息,叙词表用于表达概念使用的术语,尽量与用户使用的关键词或 自由词一致,而且最大限度地覆盖这些词汇。 1.1从论文关键词中筛选高频专业概念术语 一般情况下,论文的作者同时也是其他论文的读者,作者需要给出论文的关键词,读者在查找论文时也要使 用关键词进行检索,所以,多数数据库使用关键词作为用户检索信息的一个重要途径。叙词表进行了概念限定和 词汇规范,在叙词表编制时,尽量选用与关键词一致的术语来表达学科领域的概念,甚至努力达到所有概念术语 均来自关键词,只进行概念限定和区分概念关系,这样,只需要通过合适的途径,用户受到叙词表概念限定和知 识结构影响就町以了,而且用户自由使用的关键词多数已经被叙词表的概念术语覆盖了。所以,叙词表的概念术 语应该尽量从用户关键词中选择。 目前的巨型网络文献数据库语料,已经提供了完全的可能,即从文献关键词中选择规范的术语用于叙词表概 念的表达。例如收藏各类论文的万方数据伸1、重庆维普1、以及清华同方的CNKI哺1等,都可以提取大量的论文关键 词,而且可以按学科专业、是否在标题或文摘等处同现等多种方式进行统计,通过关键词在总体文献库中的词频 统计、关键词在专业文献库中的词频统计、以及各类共现数据统计,为规范专业术语的选择提供了科学依据,实 现了术语来自关键词的町能。笔者统计了万方数据和维普数据中期刊论文的关键词,经过去重以后,整体数量有 61l万个,为规范术语的选择提供了海量语料数据。 1.2从网络资源全文索引库中提取高频概念术语 从20世纪90年代起,因特网在世界范围内得到普及和推广,网络信息资源以指数形式增加,以全文检索形 成的关键词索引数据库,是搜索引擎的主要工作机理。提取能够反映数字资源数量和质量索引词汇,选择可以表 1资助项目:中国科学技术信息研究所中央级公益性科研院所基本科研业务费专项资金重点项目,编号:2008KPOI.3.2,项目名称:。汉 语科技词系统建设与应用工程”。

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档