香港浸会大学图书馆2. 什么是查重?.ppt

香港浸会大学图书馆2. 什么是查重?.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机自动查重程序 的算法分析 《海峡两岸服务主导型数字图书馆建设学术研讨会》 陈兆能馆长、各位图书馆同业,您们好! 首先在此多谢陈馆长、大会的筹委、工作人员、及交大图书馆员的悉心安排下,大会才得以成功举办。 我是李耀安,香港浸会大学图书馆的系统部助理图书馆主任。 今天报告的题目是 计算机自动查重程序 的算法分析 报 告 大 纲 目 标 什么是查重? 自动查重程序的系统要求 自动查重程序的工作流程 结 语 1. 目 标 香港浸会大学图书馆于 2001 年自行开发计算机自动查重程序,以完全自动化方法,取代耗时费力的传统人工采访查重、及馆藏评价的书目核对工序。 本文主要对该程序的算法作一简要述评,以供各同业先进指正。 2. 什么是查重? 2.1 采访查重 2.2 书目核对法 2.3 查重的定义 2.4 人工查重的缺点 2.5 计算机自动查重的优点 2. 查重的工作性质 查重可分为: 2.1 采访查重 2.2 书目核对法 2.1 采访查重 图书馆在进行采访工作时,为避免浪费经费购买不需要的复本,必须核查待选书目中的每一笔记录是否为馆藏所有,这样的工作程序被称为采访查重。 2.2 书目核对法 书目核对法是馆藏评鉴常用方法之一,图书馆先选择某一学科的核心或权威书目,将书目中每一项资料逐一与馆藏记录核查,计算该书目在馆藏中所占比例。馆藏中拥有比例越高,馆藏质量的评价就越高。 2.3 查重的定义 虽然采访查重与书目核对法的作用有所不同,但在对馆藏检查核对的工作程序上来说,两者是完全一样的。 所以,为了方便讨论起见,在下文的论述中将馆藏查核工序,统一简称为查重。 2.4 人工查重的缺点 长久以来,查重是一种劳力密集、千篇一律的重复性工作。 工作虽然简单,但所耗费的人力和时间却不容忽视。 而馆员在长时间进行重复单调的工作,亦会很容易产生漏检和错检的问题。 2.5 计算机自动查重的优点 浸图计算机自动查重程序的设计目的,就是以计算机程序来取代传统人工查重方式,它具有以下三个优点: 减轻馆员的劳动强度 减低漏检和错检率 能在短时间内完成大量查重工作 3. 自动查重程序的系统要求 自动查重程序由以下两个程序组成: 客户终端机程序 用 Microsoft Visual FoxPro 6.0 语言写成,可在 Pentinum III 或以上的个人计算机上运行。 服务器程序 用 Microsoft Active Server Pages 3.0 (ASP) 语言写成,在 Windows NT服务器上运行。 4. 自动查重程序的系统结构图 自动查重程序的整个工作流程大致可分为四大部分: 4.1 输入待检书目 4.2 向 Innopac Web OPAC 进行自动检索 4.3 传回馆藏记录网页 4.4 输出已检查书目 4.1 输入待检书目 自动查重程序接受以 MS Excel 电子格式储存的待检书目 各项检索字段,如 作者 书名 ISBN 必须储存于列表的不同栏位中 4.2 向 Innopac OPAC 进行自动检索 此部分程序主要是把待检书目的各项检索字段转换为 URL 字段。 并依 URL 字段向浸图的 Innopac 图书馆系统的 Web OPAC 作自动检索。 4.2 向 Innopac OPAC 进行自动检索 例如: 余秋雨: 千年一叹 (ISBN: 9571331090) 一书 向浸图 OPAC 系统检索的 URL 为 ISBN 查询: .hk/search/i?SEARCH=9571331090 作者查询: .hk/search/a?SEARCH=余秋雨 书名查询: .hk/search/t?SEARCH=千年一叹 4.3 传回馆藏记录网页 当上述的 URL 被逐一导向浸图 Innopac OPAC 系统后,OPAC 系统会依据查询数据在 Innopac 数据库中找寻相应的记录。 将搜寻结果的馆藏记录网页传回给客户终端机上的浏览器。 4.3 传回馆藏记录网页 搜寻的结果可分为: 命中 无命中 4.3 传回馆藏记录网页 无命中 若查核的检索字段并非为馆藏所有,Innopac OPAC 系统在传回的馆藏记录网页上会出现“No matches found ”意即 [未查获符合查询条件馆藏]) ,亦即是“无命中”的意思。 自动查重程序便自动把该检索字段的查重记录列为“0”。 4.3 传回馆藏记录网页 命中 若查核的检索字段为馆藏所有,Innopac OPAC系统便会显示馆藏记录网页,而在该网页中亦不会出现“No matches found”的提示语句。 查重程序便自动把该检索字段的查重记录列为“1”。 4.4 输出已检

文档评论(0)

you-you + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档