着者号码计算机自动生成系统研究.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
着者号码计算机自动生成系统研究.doc

著者号码计算机自动生成系统研究 闫凤云 摘要:在图书编目工作中,著者号码查号方法一直被许多图书馆使用,但是大多数图书馆使用的著者号都是手动查表,工作效率很低,且错码率高,我馆目前编目人员使用的就是手工查找《中文图书汉语拼音著者号码表》,经常出现著者号不统一的情况,针对这种情况,本文提出了一种利用计算机来自动完成这项工作的系统,希望能提高我馆采编部的工作效率。 关键词:图书编目 著者号 计算机自动化 1、前言 书次号是图书分类排架索书号码的重要组成部分之一,是在图书分类的基础上,为将同一类目下的不同著者区分开来而编制的决定同类书排列次序的号码.书次号码按编制方法主要有著者号、种次号、出版年月号、ISBN号等,相对而言使用著者号方式的索书号可以将同类书集中到一起,所以比较其他种索书号更有利于读者查取所需要的图书。但是使用著者号对于编目人员来说要比种次号等书次号费劲,因为种次号可以使用计算机联机编目系统提供的种次号库,点击存盘后数据自动生成所著图书的种次号,而著者号却没有现成的著者号码库,大多数图书馆都使用手工查表,这样严重影响了图书编目工作的效率,并且错码率很高,我馆采编部审校人员每月的统计报表中,著者号码错误率占所有错误的一半,针对这种情况,我编制了著者号码计算机自动化生成系统,经过深圳ILAS系统开发人员的验证,它完全可以嵌套进我们目前使用的ILAS系统中,只要在该系统切开一个小口,将著者号码自动化系统嵌套进去,就可以实现数据在存盘的同时自动生成所著图书的著者号,这样将会改进现有系统的不足,将实现输入著者拼音即可得到相应的著者号码,并可对著者号码库的相关数据进行新增、修改、删除等管理,将极大地提高编目工作人员的工作效率,减少出错率,而且该系统如果嵌套进ILAS中将会有很光明的发展前景,因为在全国高校图书馆有45%的图书馆在使用著者号这种书次号,可以联合各馆一起来使用该系统。 2、著者号取码规则 2.1 中文著者取号规则 中文著者号是以李修宇等同志编写的《中文图书汉语拼音著者号码表》为标准,主要的取码规则有:①一般著者的取号程序是:先确定著者姓氏的汉语拼音音节,后在表中找到该音节,如该音节下列有两个以上号码,再按照著者名字第一字的字头或音节取定号码。如郭沫若的“郭”音节是“Guo”,表中“Guo”音节下列有14个号码,再按“mo”的字头“m”取定郭沫若的号码是M92;②著者姓名之间必须有空格;③靠上不靠下的原则;④著者号以图书的主要责任者为取号依据;⑤无著者的图书或著者查考不清楚的以书名取著者号。书名中夹有数字或以数字开头的,以该数字的汉语拼音音节取号。 2.2 英文著者取号规则 英文著者号是以《克特著者号码表》为标准,主要的取码规则有:①图书中的著者姓名是相反的,要用著者姓作为查找对象;②著者姓名之间必须有空格;③靠上不靠下的原则④著者号以图书的主要责任者为取号对象⑤无著者的图书或著者查考不清楚的以书名取著者号。书名中夹有数字或以数字开头的,以该数字的汉语拼音音节取号。 3、系统实现的关键算法 从软件的需求和目前我馆使用的ILAS使用情况,系统实现要分三步:第一步将著者的姓名的每个汉字的拼音查找出来,即汉字拼音原代码的转换;第二步著者的名字中的每个拼音是分开的,要想查找著者的编号还须要将著者的拼音字符组合为《著者号码表》中的编码形式,第三步根据著者的拼音编码在《著者号码表》中查找对应的编号。故将整个程序分为汉字转化为拼音、汉字拼音组合成编码和查找编号三部分: 3.1 创建拼音库。中文著者取码时必须先给中文著者加注拼音,这就需要一个拼音库,给出汉字对应的拼音;汉字有2万多个,常用的有 6700多个,并且还存在着一个汉字对应多个拼音的情况,所以创建这个拼音库是比较费事的一项工作。经过调研,我采取了从Windows自带的全拼输入法,具体办法是,运行Windows2000的“输入法生成器”,选择“逆转换”打开全拼输入法编码文件C:\Windows\system\winpy.mb,再指定要输出的文件,直接输入到拼音编码输入框中进行查询,这样比把所有的汉字都处理要方便得多。 3.1.1程序实现的原理是建立一张对应表,记录所有汉字和对应的拼音,根据输入框中的汉字在此对应表中查找出其拼音,对于多音字可以查找出多个拼音,表的结构为拼音在前,用空格或者TAB键分隔,具有此读音的汉字紧跟在后,每个拼音及其汉字占一行,如下为其中的几行: a 啊阿呵吖嗄腌锕錒 ai 爱嫒暧瑷哀锿挨埃诶唉隘嗌艾哎砹癌蔼霭矮碍皑 an 安按桉氨铵庵俺鹌埯胺鞍桉案暗揞黯谙岸 ang 昂肮盎仰卬岇昻枊醃醠骯 3.1.2可以把这个对应表保存在一个文件中,每次读取文件进行拼音的查找。为了使用上的方便,可以把此文件作为程序资源的一部分,附加

文档评论(0)

busuanzi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档