- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高校图书馆特色数据库建设技术研究
高校图书馆特色数据库建设技术研究 (安徽建筑工业学院图书馆,安徽合肥230601) 摘要:文章认为,特色数据库建设一直是各高校图书馆进行数字化建设的重要内容,它必须要有很强的技术支撑,涉及到信息的采集、加工、存储、检索和发布等一系列技术应用过程。 关键词:高校图书馆;特色数据库;信息化建设 中图分类号:G250.74文献标识码:A文章编号:1007—6921(XX)05—0126—02 21世纪是知识经济和信息化的时代,数字资源建设已经成为评价一所学校图书馆资源建设的重要标志,也是数字图书馆建设的核心,这其中尤以特色数据库建设最受关注。特色数据库是数字图书馆开展信息服务最主要的信息资源,是传统图书馆特色馆藏在数字时代的另一种表现形式。特色数据库建设需要大量的技术支持,从信息资源的采集、加工、存储、检索和发布等涉及一系列的技术应用过程。1信息采集技术 信息资源是构成特色数据库的主要内容和表现形式,随着多媒体技术的发展,目前可纳入数据库收录范围的信息包括文本、图像、音频和视频等多种形式,这些不同形式的资源纳入到数据库中必须经过严格的数字化技术处理,使其符合一定的标准规范。1.1扫描技术 这是最常用的,能够快速将大量印刷型文献进行数字化的技术。其具体做法是采用光学扫描仪、数码相机等将现有的纸介质文献经模数转换成位图。数字化文件通常以压缩形式存储,一般的数字化项目需要有多套存储方案,例如可以采用无损压缩算法的TIF格式保存一套方案,再加工一套采用有损压缩的,可供上网发布用的JPEG或GIF格式文件。1.2光学字符识别 它是利用计算机软件把扫描的图像文献转换成字符文本的方法。它的工作原理是通过扫描仪等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储为计算机的文本文件。因此,OCR实际上是让计算机认字,实现文字自动输入。1.3视音频捕捉 这是对多媒体信息进行数字化的处理过程,其基本原理也是通过数字化采样而进行模数转换,设定一定的采样频率,例如通过声卡、帧捕获器或影视影像数字卡可将模拟的音频、录像材料转换成以数字方式存储的电子文档,采用标准压缩和标准格式存储其数字化资源。2信息加工技术 文本、图像、音频、视频信息资源加工技术一般要用到自动标引技术、人工标引技术和元数据技术。2.1自动标引和人工标引技术 主要涉及主题标引和分类标引。主题标引是以主题词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词或采用自然语言的词语标识主题内容,并将其组织成表达信息资源内容特征标识系统的过程。而分类标引是依据一定的分类体系,对信息记录的内容特征进行分析、判断,赋予分类标识的过程。 人工标引是直接由标引人员对信息记录进行分类标引或主题标引,赋予特定检索标识的工作,但是由于标引人员水平的不同和信息资源所存在的语义上的歧义,造成同一篇文献不同人员的标引不一致。而自动标引技术则以主题词表和分类表为基础,为标引人员自动生成主题和分类,并且可以对人工标引进行校对。2.2元数据技术 元数据是描述和限定其它数据的数据,它的应用领域非常广泛,在特色数据库建设的信息加工过程中,也要用到元数据技术。元数据在数据库中的功能是描述和定位信息资源,标准的元数据描述可以使分散的异构网用户分享和再利用不同类型的数据。3信息存储技术 信息存储是对加工后的信息进行科学有序的存放、保管,以便使用的过程。它包括两层含义:①将加工后的信息按照一定规则,记录在相应的信息载体上;②将这些信息载体,按照一定的特征和内容性质组成系统有序的、可供自己或他人检索的集合体。传统的信息存储技术有印刷存储、缩微存储、磁存储、半导体存储和光盘存储,在网络环境下,信息的存储已成为网络设计中的一个重要的环节。目前,数字化信息资源的存储技术主要有以下几种:3.1直接连接存储 它的原理是存储器通过一个通用服务器连接在网络上,存储器与服务器之间通过传统的I/O总线通信。客户机如需要访问存储器的数据,首先必须给文件服务器发送一个请求消息,文件服务器解析这个请求并给存储器发送访问消息,存储器访问数据并发送至文件服务器的内存,最终由服务器把数据传给客户机。3.2网络连接存储 NAS是一种独立地直接存储的联网方案,它转变“以服务器为中心”的存储方案为“以数据为中心”的智能网络服务器方案。它是基于LAN的,按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据信息传输。3.3存储区域网络 SAN是一种数据存储设备及服务器间通信的专用网络,能够提供几乎无限的信息交换能力。存储区域网上的服务器可以通过SAN直接访问存储设备,而无需通过局域网。SAN是
文档评论(0)