- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*●元数据是描述数字资源的文件,是关于数据的数据,免费共享!因数据小,检索速度快,发展成为先进的元数据搜索引擎。●超星公司有专人搜索元数据,图书元数据最齐全,到2023年达到680万种中文书目元数据[1]。(3)对象数据分布式存储数字图书馆的对象数据是海量的,因此存储空间是海量的,为减轻网络传送压力和安全,对象数据可用分布式存储。超星公司的数字化全文图书,到2023年达到400万种图书全文[1]。按超星拥有自主知识产权的国际上中文图像格式占用空间最小的一种压缩技术,做到100万种图书大约有5000G≈5T300万种图书全文≈15T,按照此标准,Google想把全世界3000万种图书数字化——完成后也有150T。(2)元数据共享原则[1]资料来源:图书被引用情况报告(2023)《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*元数据搜索引擎速度快,但当元数据的量达到海量时,对搜索引擎的检索能力是一个非常大的考验?如超星公司学术文献元数据已达6.6亿条,每个条元数据大约50个字段,约1.5K字节,则元数据有:650000000×1.5≈929G,在这么大的元数据库里检索,需要有更强大的查询工具,来满足用户大并发、多条件的检索要求。(5)计算机和网络系统的承载能力对象数据将是海量的,这就需要海量的存储空间。●对象数据必须分散在各个地方,解决大的并发和大的传输量,传送实行就近原则,以减轻网络的负担。(4)搜索引擎的检索能力《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*2.2.3图书数字的工业化进程目前,国内进行图书数字化加工的公司的有:①中国数字图书馆有限责任公司;②方正阿帕比Apabi;③北京超星数图信息技术有限公司(简称超星公司)●超星公司的技术最成熟,技术最先进,规模也最大,成为行业的领跑者,为中国数字图书馆建设做出了突出的贡献!《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*1.超星公司数字化图书发展历程超星公司1993年成立,是一家高科技民营企业。(1)从档案资料数字化起家超星公司从1993年起从事档案资料数字化软件的开发,国内最早提出档案资料数字化的概念,以光盘存储代替缩微胶片进行档案保存,发展了国内第一家以光盘形式存储档案的档案馆用户。●用户数量达2000多家,中央档案馆、外经贸部、林业部、中国人民银行总行、招商银行总行、北京市公安局和全国印钞造币系统等都是超星的用户。(2)把资料数字化技术应用于电子出版物;(3)把资料数字化技术应用于网络;(4)与国家图书馆合作创建“网上读书”取得实用经验;《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*2.图书数字化加工厂(1)图书数字化加工生产线(DocScan)1998年,超星公司第一条大规模数字化扫描生产线,加工能力达到每天20万页。(按每册300页计算,有660册图书)五个数字化加工中心:在北京、成都、福州、长沙、郑州等生产流水线作业,三班倒的方式,进行图书数字化——扫描;入口:图书送进去,通过工人拆开、扫描,整个流水线采用C/S结构,客户端完成扫描加工处理,服务器完成数据管理和各工序任务的分配。出口:数字图书——建设数字图书馆的基础资源。到2023年,已经扫描中文图书400万种(全文数据)。《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*(2)从数字图书→数字图书馆加工数字图书的目的——是为了建设数字图书馆。当数字图书的数量达到400多万种时,已是一个相当大规模的数字图书馆了,什么样的中文图书都可以在这里找到,满足率可达到95%,这个数字图书馆对读者是一个非常好的解决思路。(3)超星数字图书馆的社会效益超星数字图书馆是世界上最大的中文在线数字图书馆。它为偏僻山区、中国的西部的市民都可以和大城市享有同样的阅读条件和教育机会,而且是24小时、没有等候的服务。它是缩小东西部数字鸿沟差距、解决网上资源匮乏的重要举措。《现代文献检索与利用》第4版/饶宗政成都工业学院图书馆/制作*超星的PDG格式2000年11月,超星与清华大学图书馆技术部联合开发的PDG图像全文检索技术。超星PDG应该是在参考了djvu技术的基础上开发的格式。名词解释:DjVuDjVu是于1996年开发成功的一项新的图片压缩技术,是一个公开标准。作为一种新的彩色文件压缩技术,DjVu在纸质世界和比特[1]世界之间搭起了一座桥梁。它使得高质量的扫描图像可以轻易地在因特网上进行发布。DjVu
文档评论(0)