- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
张智雄 吴振新 中国科学院国家科学图书馆.信息系统部 2007-08-15 桂林 提纲 项目背景 系统目标 长期保存技术体系 项目包括的几项工作 试验资源的选择 原型系统的选择 内容模型以及元数据方案的制定 试验系统的总体功能,建设思路,架构,数据库设计 项目进展状况 项目背景 我国科教领域严重依赖于数字信息资源 数字信息资源本身固有的脆弱性及其对应用环境(软硬件环境,如技术环境、使用许可、法律法规)的依赖性; 欧美等发达的国家图书馆和相关联盟大力开展研究和试验活动; 国内的长期保存在实践方面比较薄弱; 项目背景 国科图近几年来围绕着数字长期保存领域进行多项研究活动: 数字资源持久保存国际合作试验项目(CSDL项目) ; 数字化科技信息资源长期保存体系与政策机制(NSDL项目); 网络信息资源保存的理论与方法研究(社会科学基金) 培养了一支从事数字资源长期保存研究团队; 本方向已经成为今后的一个重点发展领域; 系统目标 构建一个规范化的数字信息资源长期保存示范性系统; 选择一定规模的数字科技信息试验资源; 保障被保存对象在数字保存的全生命周期中的任何时候的都能够保持完整性、真实性、可理解性 保障原有数字信息资源能够在较短时间内得以快速恢复和部署,在原有的内容形式下,在原有服务范围内提供服务; 保障被保存的数字信息资源能够在长期保存系统中方便、快捷、可靠进行迁移,支持存储媒体的管理和翻新。 系统要求 系统的功能和性能要求 遵循OAIS模型,具备基本功能。 遵循开放的技术标准和规范 能够对数字对象进行有效的生命周期管理 …… 工作流程规范要求:制定相关的工作流程规范及评价机制 管理规范要求 长期保存技术体系 提纲 项目背景 系统目标 长期保存技术体系 项目包括的几项工作 试验资源的选择 原型系统的选择 内容模型以及元数据方案的制定 试验系统的总体功能,建设思路,架构,数据库设计 项目进展状况 试验资源的选择和分析 资源对象选择的考虑因素 资源对象的保存意义 资源对象的示范意义 资源对象的代表性 资源对象提供方的合作意向与合作态度 资源的选择和分析 目标资源 SpringerLink电子期刊数据库、Springer电子图书数据库 综合收录各种学术期刊1250余种,目前共收录期刊论文2,761,094篇.目前院属59家机构参加集团购买, 2006年全院下载Springe电子期刊论文全文385551篇。 2万余种STM类电子图书,年增量3,000种。 目前状况:镜像服务器只保存期刊论文的PDF全文,未保存元数据, 不提供服务功能。未涉及“长期保存”的条款。 只提供数据级的(PDF全文和SGML格式元数据)保存,补充授权协议,数据样例已提供。 试验资源的选择和分析 其它目标资源 Nature系列电子出版物 维普中文科技期刊数据库 ACS(美国化学学会)电子期刊数据库 方正Apabi中文电子图书 英国物理学会(IOP)全文电子期刊数据库 英国牛津大学出版社(OUP)全文电子期刊数据库 原型系统的选择 选择fedora作为底层仓储 与Dspace和Eprint相比,Fedora有什么不同: 数字对象模型 开放和清晰的开发接口 是toolkit,而不是canned application 得到越来越多的支持 Fedora Services framework 制定内容模型及元数据方案 采用FOXML作为数字对象的摄入、存储、输出格式,即SIP、AIP、DIP 细粒度 期刊论文-每篇,PDF/per article 图书-每本 每章-PDF/per Chapter 内容层级 集合级(collection):数据库以及子数据库 条目级(item):原子数据,article,Chapte,Book 内容模型及元数据方案 对象内容模型类型: 集合类型的数字对象 非集合类型数字对象 每种类型数字对象有各自的内容模型定义。 数据库及子库=Collection 期刊论文集合=JournalArticleSet 期刊论文=JournalArticle 电子书=Book 电子书章节=BookCharpter 制定了各种类型数字对象的元数据方案 内容模型及元数据方案 通用的数字对象内容模型 Persistent ID Dublin Core(DC) Relation(RELS_EXT) Audit Trail(AUDIT) Disseminator Datastreams NslDescMeta ? text/xml 描述元数据 NslAdmMeta ? text/xml 管理元数据 NslPresMeta ? text/xml 保存元数据 NslTechMeta ? text/xml 技术元数据 Norma
文档评论(0)