- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用EXCEL COMPARE实现图书数据简单比对.pdf
,
2015 年第 14 期 经济研究导刊 No.14 2015
总第 268 期 ECONOMIC RESEARCH GUIDE Serial No.268
利用 EXCEL COMPARE 实现图书数据简单比对
回 玲
(新疆农业大学 科学技术学院 ,乌鲁木齐 830052 )
摘 要:要提高馆藏数据的正确性与完整性,比对过程更加有效、灵活,研究分析图书 ISBN 号位和题名的规律,
利用 Excel Compare 工具实现图书数据比对。 在图书数据比对过程中,对书目数据中每一条记录的有效字段内容与馆
藏数据(包括已编目的数据)的字段内容进行比对,确保图书数据准确无误。 其方法简单快捷、操作方便。
关键词: 图书数据;数据比对;COMPARE
中图分类号:G250.74 文献标志码 :A 文章编号:1673-291X(2015 )14-0293-02
随着信息技术发展,数据分析已成为信息资源的重要部 据比对图书数据时造成比对结果不精确。 如《国学》一书的书
分,大数据的时代,繁冗的数据处理不再适合手工比对。 对于 名包含有繁体和简体字两种。 因此,在比对之前因将繁体字
图书馆而言,在书目采访、验收和编目等工作流程之后,数据 都化为简体字,可以有效查出 因著录繁简字而被电脑判定为
比对是必不可少的一个重要环节,尤其是在结算图书费用、减 不重复的书。
少图书错误著录方面,占据着重要地位。 在很大程度上,图书 2.数字的不统一
数据比对更能解决馆藏数据的完整与正确问题。 因此,图书 将书目以阿拉伯数字统一为汉字数字是标准化数据,方
数据比对是否简洁、方便,效果是否明显,对节约资源购买经 便数据的比对。 对于包含多册的书目而言,有些 图书供应商
费以及资源的质量十分重要。 著录数据时用汉字表示 ,有些则采用阿拉伯数字。 如《明朝那
些事》有多部,图书供应商在著录时分别按照“第一部”和“第
一、数据比对技术 1 部”重复著录了两次 。 如果根据题名字段比对,比对程序将
在信息资源的管理和组织中,数据比对技术一直占据着 判断为两本不同的书,导致重复购买。 因此,在比对之前,需
相当重要的地位,尤其是在大数据环境下,比对技术与查重 要将数字标准化。 将 图书数据数字统一为汉字形式。
技术结合成为现代数据校验技术发展的主流。 现今比对的 3.丛书类重复书籍
函数主要包括 IF 、VLOOKUP 、COMPARE 等,其中COMPARE 有一些书目 ISBN 号位相同但题名不同,有些则是 ISBN
技术的比对的数据误差最小,速度最快,比对完全是表与表 号位不同但题名相同,对于这样 的丛书要进行筛选和甄别是
之间的数据交互,界面简单,操作便捷,减少图书工作人员用 否是同一本书,是否供应商著录错误,确定丛书的数量,减少
眼的工作强度,效率相对 EXCEL 中其他函数有所提高。 本文 馆藏不必要书目重复率,保证读者 的阅读质量。
(
利用开发工具—— CEL COMPARE 基于数据比对技术环 二 )购书清单数据与著录数据的的准确性
—EX
境运行简单,可用在图书馆数据比对或其他资源比对环境中。 图书供应商要确保购书清单的准确性 ,如购书清单提供
的 ISBN 号位与图书本身不相同,购书清单是 9 位数字而图书
二、数
文档评论(0)