浅论计算机辅助标引CAI系统.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅论计算机辅助标引CAI系统.pdf

120 中国科技情报学会北京科技情报学会 浅论计算机辅助标EJ I(CAI)系.统 王 勇1 摘要:本文重点介绍了计算机辅助标引中联机词表的属性与系统设计,以及它与一般词 表管理系统的区别.详细阐述了联机词表的主题叙词快速定位自由词的共享和实时再现 词表数据实时更新和标引轨迹智能记录等基本属性,并提出了计算机辅助标引系统应具备 的基本功能,这对计算机辅助标引的研究具有一定的借鉴意义。 关键词:联机词表计算机辅助标引 词表作为标引和情报检索中最重要而又最常用的工具之一,发展至今大致经历三个阶 段:文本型词表,以书本形式记录词及词间关系,主要用于手工标引和检索:机读词表, 即印刷型词表的计算机可读形式,也指在计算机帮助下能部分或完全地修改或扩展的印刷 型词表,主要用于管理,用于辅助词表编制和辅助叙词标引:联机词表则指和一定的数据 库配套使用的词表(或字典),它不仅包括主题词表,还包括数据库使用的基本索引,并非 所有的数据库都有主题词表,然而总有一个词典文档或基本索引记录了包含各词的记录数 目,词典可以收入语义上相关的词,其作用相当于词表。 综观词表的发展历程,可以看出不论词表的载体是纸张型还是电子型,手工操作还是 机器操作,词表记录的内容一直是两个方面:词及词间关系。纸张型词表反映的词及词间 关系有一定的滞后日期:电子型词表虽然可以缩短滞后日期,提高选词的速度和准确性, 然而也并不能实时反映已有的数目库中标引用词词间关系,因而标引和检索时使用的也是 相对不完善的词表。为了提高标引质量和检索效率,将联机词表加以改进,从而形成联机 词表的专家原型。 联机词表的专家原型就是指基于计算机处理的,在标引时累积标引经验,并将标引经 验用于随后的标引和检索中的词表。它将词间关系划分为两个层次:A相对静态的关系, 如词的族性关系、参照关系;B实时动态关系,由原始的标引和检索经验累积而成的词间 关系。前者实现了一般词表的功能;后者则是和特定书目库相联系的动态经验,不再局限 于叙词的族或参照关系,而形成基于经验的泛参照。动态关系映射了跨族、跨参照的词间 关系链,揭示词间关系动态性,并将其实时记录和显示。 引入一个例子说明专家原型:有两篇曾经标引的文献,标引用词为: A计算机辅助标引,情报检索,主题词表; B计算机辅助标引,情报检索,情报处理; 当标引第三篇文献时,当起用叙词“计算机辅助标引”,系统将提示:“情报检索”, “主题词表”,“情报处理”,按相关关系从高到底排列。 同样,在检索时如果输入“情报检索”,将提示相关待选词条。这样,在检索时能够 提供和特定数据库联系的动态词间关系,而特定数据库中没有的主题将在提示中因得不到 任何信息而屏蔽。 100037 1核科学技术情报研究所图书馆北京市2103信箱三室 信息技术高级研讨会烟台2001.7 12l 所以,联机词表的专家原型的一种可以尝试的思路就是词间动态关系的保存和实时再 现。 1联机词表属性 (1)联机词表抛弃了纸张词表的一些属性 将专家原型引入联机词表,必须对词表及词表的操作加以调整。专家原型是基于具有 高速处理性能的计算机应用的,因而将一些纸张型词表的功能加以撤消或改进,另外还加 上自身的若干属性。 纸张型词表由于自身的局限,在叙词的“重定位”、“重入”、“重构”方面不能得 到较好地解决。如‘社会科学叙词表》、 《教育科学主题词表》和《中国人口主题词表》 等词表,都为每个叙词增加了该词在字顺表中的序号,同时在其它结构中,如分类表,轮 排表,英汉对照索引等处叙词后也列出这个号,一定程度上提高了“重定位”、“重入” 的速度。然而实际使用时仍比较麻烦。对于高速处理的计算机,这些问题根本无须考虑。 比如为文本检索方便使用的轮排表,可由程序的模糊匹配解决,只在显示时加以排序即可。 (2)联机词表自身属性 计算机介入标引工作,简化了标引人员的手工劳动,更重要的是使得标引资源能够共 建共享,并由此达到标引工作的无纸化、标引用词规范化、标引过程

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档