- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机编目查重问题研究
王春秀
(浙江海洋学院图书馆, 浙江舟山 316004)
[摘要] 何谓复本?这是进行查重工作首先要解决的问题。对复本涵义理解的不同会产生不同的结果。而查重工作的质量直接影响到书目数据库的质量和读者对书目数据的正常使用。为提高查全率和查准率,文章结合工作实际,讨论了在查重过程中,检索点的选择和不同查重途径需要注意的问题。
[关键词] 查重 准确率 检索点
The computer catalog duplicate checking research
Abstract: What is duplicate? This question is the first one we should to solve. Different comprehension lead to different result. This result directly influence catalogue database.and the use of reader. Thid paper discussed the selection of the index point and the duplicate checking operation with practice.
Key words: Duplicate checking Rate of accuracy Index point
查重,也就是查复本。但是何谓复本?在现实工作中,不同的分编人员对复本的概念认识不一,这种认识上的偏差,给我们的分编和查重工作造成了一定的混乱。笔者对近几年发表的相关论文进行了分析,讨论的观点不外乎几种情况:书名相同,责任者相同,版次相同,出版者相同而ISBN不同的能不能视为复本书;书名相同,责任者相同,ISBN相同而内容不同的能不能视为复本书;书名相同,责任者相同,ISBN相同,内容大致相同,版次不同的能不能视为复本书。周爱莲老师在其《计算机编目查重探讨》一文中这样定义:“若在编图书与某一馆藏记录的题名、责任者、出版项、ISBN等著录信息完全相同,则为重书,也称复本。”各个著录项目完全相同当然是复本无疑,但对有疑问的图书没有作出深入探讨。笔者认为,查重的目的就是类分文献,使同种书能够集中归类,保证文献分类标引前后一致,避免“同书异号、”“异书同号”,为读者更好的使用图书服务。内容是否相同是辨别复本的标准,这些问题在后面有更详细的阐述。当然,见仁见智,但只要每个图书馆能够统一认识,由业务部门制定复本规定,那么复本书的分类标引工作就会有章可循。
查重的目的、意义
查重是计算机编目的第一步。提高查重准确率,是保证图书馆书目数据质量的关键,高质量的查重工作可以使同种文献分类标识保持前后一致,从而避免同书异号,一书两入现象。
查重还可对相同图书或相关联图书进行辅助分类(如配套出版物,再版图书),便于图书的集中管理和读者的使用。
在查重过程中,我们可以发现和纠正数据库中的问题记录并加以改正。如利用ISBN查重查不到《发现谦卑的力量》这本书,但通过改用题名检索途径检索到了,经过对比发现,编目员在编目时,把7-208-05195-X错误的录入为7-308-05195-X,才造成了漏检,因此我们通过查重,不仅给新到复本图书进行了统一、规范的分类标识,而且改正了数据库中的数据遗留错误。
同时,在经费紧张的情况下,查重也是图书馆必不可少的一道工序。它可使有限的资金得到最大程度的利用,最大程度的满足读者的需求。
检索途径的选择与适用
与传统的手工目录查重相比,计算机编目系统可供选择的检索点很多, 我们经常用到的、具有标识意义的检索点主要有ISBN、题名、责任者。应该说,它们没有好坏或主次之分,而仅仅是适合不同的情况。下面就予以分别说明:
2.1 题名查重
题名查重是最常用的查重方式,其查全率和查准率都较高。利用计算机进行题名查重主要有两种方式:
一是准确检索,即将图书的题名全部准确的输入计算机进行查重检索。在这种情况下,如果题名过于简单,重复的可能性会很大,需要比较的记录过多,操作起来不便,如高等数学,大学英语等;对于题名复杂或冗长的,录入起来又不方便。而且,在有些情况下还可能造成漏检。比如题名本身著录错误等。
二是模糊检索,或可称为前截词检索,即只将题名的前一部分输入计算机进行检索,这样就可以将馆藏数据库中题名前一部分与该图书题名相同的图书都可以检索出来,它的优势是能尽量避免漏检。
在这里还要强调的三点,一、注意题名中标点符号的处理。中文普通图书编目规则规定:正题名中所含标点、符号、数字、汉语拼音及外文字母照录,起语法作用的空格保留。因此,在正题名中若出现这些符号,应按汉字输入规则(一个符号占2个字
文档评论(0)