曾蕾数字保存DigitalPreservation-北京交通大学图书馆.PPT

曾蕾数字保存DigitalPreservation-北京交通大学图书馆.PPT

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
曾蕾数字保存DigitalPreservation-北京交通大学图书馆

数字保存 Digital Preservation -- For the Future of the Past 大纲 1. 数字资源的类型 2. 对数字资源长期保存的需求 3. 数字资源的特点 4. 什么应该得到长期保存,谁的责任 5. 数字保存的方法 目前在座各位可能面对的资源 目前在座各位可能面临的情况 决定是否要担起保存数字资源的责任 拿出一个数字保存的计划来 生产/制造预计会有长期价值的数字物件 收藏数字物件并决定是否要长期保存之 判断目前对数字典藏管理的长期保存安排是否有效 进一步完善现有计划项目 建立合作计划 鼓励和帮助其他单位建立新的保存计划 负责存档(archiving)和保存(preservation) 管理数字保存项目 与 生产制造者一起生产/制造可保存的数字内容 决定什么需要保存 将数字物件转到档案 (archive)中 为存档的数字物件起名、描述、控制管理等 处理对保存有影响的法律方面的事务 保护和存储数字信息资源的数据(data) 为重新显示存档物件以便获取而维护必需环境和方式 1. 数字资源的类型 第一大类:数字再造资源 数字资源中有一部分是对以前存在的物件 进行数字化再造的产品 digital “double” -- 数字拷贝 不声称与原作一模一样,只是原物的一种表现形式 往往能利用数字化的特长将原物更好展现和利用 数字米开朗琪罗项目 Digital Michelangelo Project height of gantry: 7.5 meters weight of gantry: 800 kilograms 扫描大卫 480个专门定位的扫描 2亿个多边形建模 7,000 彩色图像 32 gigabytes 30 个通宵扫描 22 位老师和学生 1998.9-1999.6 第二类数字资源来自于那些仅仅以数字形式存在的数据 例如: 万维网网站 电子出版物 多媒体产品 文化或科技数据库 ... 人类基因组计划 The Human Genome Project 人类基因组计划 (1990- 2003) 支持的数据库含有全球合作的结果(美国、英国、日本、法国、德国、中国等国家的科学家) 阐明人类基因组30亿个碱基对( chemical base pairs)的序列, 发现所有人类基因 (20,000-25,000) 并搞清其在染色体上的位置 将这些信息存放在数据库中,不断更新 改善数据分析的各种工具 为30亿个碱基对构成的人类基因组精确测序,从而最终弄清楚每种基因制造的蛋白质及其作用 越来越多的有价值的内容是‘天生的数字型’,而且只能以数字形式来管理、保存、使用之。 2. 对数字资源长期保存的需求 有的数据已无法再读 Example: 1960美国人口调查统计数据 1960 人口调查统计数据 存储在只有用UNIVAC type II-A tape drive才能读的磁带上 全世界只有两台机器可以读,一台在日本,一台在Smithsonian 博物馆 很多类似的信息已经永远无法获取了,实例举不胜举 早期因特网的很多数字物件已不复存在 从1995到1999 年在IEEE Computer 和 Communications of the ACM 上被引用的文献在2000年时就有28% 不再可获,到2002年增加到 41% 目前科研单位面临着管理海量的各式类型数据的挑战 有些每天就有成百上千个GB. laboratory experiments, life-size experiments observations from various instruments (satellites, radar, telescopes, probes, sensors, microscopic cameras, etc.), 其中有些包括永远不可能重复的历史性事件 数字技术发展太快,人类还没有相应的完善的应对计划和方法 3. 数字资源的特点 技术发明和有效年限 作为信息载体的巨石已经存在了几千年 书本--几百年 声像产品--几十年 因特网–- 才十年左右 不稳定性 预测英特网上有1亿多网页的寿命只有44天到2年 生存下来的有很大一部分在一年内都会有变 OCLC的IP地址波动 (volatility) 研究 在A年测到的网站的IP地址在B年仍然存在的百分比 所有网站: (续)在A年测到的网站的IP地址在B年仍然存在的百分比 公众网站: 被废弃的媒体 在数字环境中,要保留下来的不是酒瓶,而是瓶中之酒. 电子文献采用的新媒体比以前的更脆弱易损,使用年限更短. 无固定住所的记忆 信息与载体分离 内容 容器 信息的这两个因

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档