网站大量收购独家精品文档,联系QQ:2885784924

whybotherinChinese.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
whybotherinChinese

网络数据存档的存在问题 B.Kahle 2000.3 原始出处:.au/hans0602.ppt bluerye(DXY)译 网络数据存档的存在问题 “网络站点无论队一个机构的数字资产,还是对于一个国家的信息和文化遗传都起着越来越重要的作用”(JISC 2002.4) “许多历史上的信息,生来就是数字化的。这点不同于早期的电视,因为它并没有记录。”(Brewster Kahle 2002.3) 网络存档的存在问题 澳大利亚 美国 北欧国家:丹麦 芬兰 瑞典 其他国家:英国 法国 日本 国际网络数据的存档库 例如:“wayback Machine” 三个会议 数据储存图书馆的未来 达姆施塔特[德国] 2001.9 国际数据网络存档大会 东京 2002.1 DPC论坛:网络数据存档 伦敦 2002.3 会议网站 http://www.bnf.fr/pages/infopro/dliECDL2001.htm http://www.ndl.go.jp/enews/sympoeng.html http://www.jisc.ac.uk/dner/preservation/webforum.html 存在问题 储存数字化信息的合法性? 版权? 是否允许访问和对公众开放? 选择一部分还是全部储存? 多长时间更新介质?何时更新? 如何在多变的网络中获得信息? 技术上面临的挑战 嵌入的外部链接和可执行程序 不变的名称和数据标识 复制控制 内容随时间的变化 表层网页和深层网页 澳大利亚(潘多拉档案库) NLA:.au/pandora 仍没有合法地位 储存公有的出版物 选择性储存 ( 澳大利亚电子刊物,组织化站点, 政府出版物,短期资源) 允许公众访问 -NDB条款 澳大利亚(潘多拉档案库) ~1700个标题(2001.11) 增长率:每月40站点 重新整理:每月35站点 ADRI(澳大利亚数字资源确认) 独特的确认方法 自身处理系统 美国(雅典娜议档案库)-议会图书馆 将互联网资源制图,可视化档案库 可通过网页访问资源 版权的合法性正在论证阶段 选择性收录 对公众公开 LC/IA 领航计划-“Election 2000” 将网上和议会资源库共享 目标: 图书馆:选择收集和分类站点;建造原型访问站点 网络档案库:在整理和归档站点的过程中学习经验 800多个站点(在这些站点中包括150多个选择后的站点和主要) 数据量有2-3万亿字节 每日归档(2000.8~2001.1) 丹麦 皇家图书馆,哥本哈根 出版物的储存有一定法律权限 非动态的静态出版物-有限的站点 只允许皇家图书馆,国立图书馆和大学图书馆访问 只归档静态站点(专论和过刊) 奥尔胡斯会在每天夜里为国立和大学图书馆提供镜像站点 丹麦(统计数字) 9000 网络出版物 (2001.6) -31%为专论,69%为过刊 -67.5%来自公共部门和图书馆,32.5%来自私立部门 工作人员中有0.5是技术人员,0.8是图书管理员 瑞典皇家图书馆 每年若干次对本国站点进行扫描 -不选择,收录一切 -包括所有网页,所有电子刊物,所有新闻 -包括.se-,.com,.org,.net在内的所有使用瑞典地址和电话号码的网站。 -只归档但不允许访问。 瑞典 软件 使用Whois软件鉴定本国的站点 使用COMBINE Robot软件收录站点 -自动从超链接中收集文章 -同时收录图片和声音文件 -全自动化无需人为帮助 瑞典档案库(Kulturarw3) http://www.kb.se/kw3 所有资源都作为一个多部分的MIME一个元数据储存在一个文件里面 文件命名:33个字符以及记录时间 截至到2001.9:从97000个网络服务器中活得110,000,000文件,总计3000G字节的数据量 储存在磁盘和碟片中,用分等储存管理(HSM)管理文件 瑞典档案库(Kulturarw3) 直到2002.7,只有部分法定权限(一些固定的网络文件) 2001.12,数据核查联合会的确认计划被认为违法。于是改计划被叫停了。 2002.7,修改后的瑞典版权法,给予了瑞典皇家图书馆以收集本国网站和公开档案库的合法地位 芬兰 国际图书馆 使用了和瑞典类似的方案,最初只是负责本国范围之内。 具有收集数据资源的合法性和版权 使用芬兰的来自NEDLIB的软件收集数据。 档案元数据 使用MD5校验和的方法控制复制,这种方法较为权威而且具有唯一的认证码 配合时间标识作为一种挽救措施 芬兰-现行的数据收集情况 200

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档