知网数字资源保存实践.pptVIP

  • 4
  • 0
  • 约2.52千字
  • 约 27页
  • 2017-04-13 发布于湖北
  • 举报
知网数字资源保存实践 中国知网 2013/9/10 北京 提纲 知网资源的现状 知网资源保存中的问题 知网资源保存的技术方案 知网资源的现状 学术期刊: 4000万篇 博硕士论文: 200万本 会议论文: 200万篇 报纸论文: 1200万篇 工具书: 1800万条 统计年鉴: 200万条 专利: 4100万条 标准: 59万条 外文题录: 1.2亿条 每年新增: 600万条/篇 数据规模 学术期刊: 16TB 博硕士论文: 10TB 会议论文: 1TB 报纸论文: 1TB 工具书: 0.5TB 年鉴统计年鉴: 2TB 专利: 6TB 图片库: 9TB 其他: 2TB 日志数据 32TB 合计: 79.5TB 年新增数据: 10TB 数据规模 TB 知网数字资源保存的范围 原始数据 出版商 合作单位 网络采集 中间格式数据 元数据 统一格式数据 文本,图像,视屏 规范数据 作者 机构 标引 分类 关联数据 知识元 引用 相似 下载数据 出版产品数据 数据库 访问日志 各数据库访问情况 各出版物访问情况 互联网资源 博客、报纸、媒体、行业机构、论文、港澳台、OA资源、大学网站、政府类网站 系统数据 维持系统服务的相关配置数据,系统环境数据 变化的 系统 知网资源保存的特点 静态的资源 原始数据 出版商 合作单位 缓慢变化资源 元数据,少量

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档