- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
贵州省图书馆数字
资源建设项目
(技术分册)
贵州省百年招标中心
2016 年4 月
1
贵州省图书馆数字资源
建设项目技术分册
内容一
2016年4月
2
附件6
推广工程数字资源联合建设
网事典藏项目建设方案 (2015)
一、建设内容
网事典藏项目建设初期先以政府网站的采集和存档为
重点,主要采集反映所在行政区域的政治、经济、文化发展
等信息的政府网站,并将采集到的网站进行编目和发布。各
馆原则上只采集行政上从属于本地区的政府网站。
二、工作流程
1.采集准备
按照网事典藏项目建设内容,对符合收录要求的政府网
站进行全面整理,确定采集范围。将需要采集的政府网站网
址 (URL地址)整理成采集列表 (EXCEL表格),市馆提交给
省馆初审,省馆初审后,连同初审意见一同提交给国家图书
馆审核,由国家图书馆出具审核意见。
2.资源采集
根据采集列表,利用网络采集软件,对政府网站进行全
面采集,要求所采集的文件包含采集列表中政府网站域名内
的全部内容,但不包括论坛等需链接后台数据库的内容。所
采集的文档格式遵循WARC1.0标准,不含病毒、垃圾文件及
采集列表外的其他信息。每个网站单独采集。
3.数据发布
将采集到的文档 (WARC文档)数据进行索引后发布,保
3
证页面内容都能正常打开,且与原网站保持一致。
4.元数据制作
按照 《推广工程数字资源联合建设政府网站元数据著录
规则 (2015)》对采集到的政府网站进行元数据制作,每个
采集结果对应一条完整的元数据。需要在唯一标识符系统中
注册CDOI。
5.数据验收
按照联建方案规定的项目进度,各馆在规定日期之前,
向国家图书馆提交已由第三方机构初检合格的全部数字资
源。经国家图书馆终验合格后,提交成品数据。
6.数据维护和长期保存
各馆负责对本机构制作、发布的信息及其发布网站进行
长期维护,保障数据准确无误,显示正常,同时做好数据备
份与长期保存工作。
三、成果提交
1.元数据:元数据以EXCEL表格方式提交。
2.对象数据:采集的政府网站需要在推广工程专用网络
内发布,为用户提供服务。
3.第三方质检报告。
注: 相关规则及表格请登录推广工程网站 “文件下载”
栏目查看。网址:/cswjxz/)。
4
推广工程数字资源联合建设政府网站元数
据著录规则 (2015 )
1.著录对象
著录对象为存档的政府网站。以单次存档的政府网站为一个著录
单位。如果一个政府网站具有多个主页域名,著录时作为一个对象著
录。
2.著录要求
对采集的政府网站进行编目加工,要求参照著录规则进行编目。
元数据以EXCEL文件形式提交,元数据著录规则如下:
术语 必备性 著录内容
著录元数据的一个明确标识,具体规则见《政府网
加工编号 必备
站采集加工编号命名规则》。
CDOI 必备 著录所采集网站的唯一标识号。
著录网站名称。信息源取自网站页面首页源代码中
网站名称 必备 的title。若title为空,或不反映网站内容,
可用网站其他位置明显反映网站内容的名称。
您可能关注的文档
最近下载
- 塔望食品品牌策划:品牌就是生意,功能饮料行业如何正确品牌定位.pdf VIP
- 2023春国开电大《行政法与行政诉讼法》形考任务(形成性考核作业1)试题及答案.pdf VIP
- HGT20592_20635-2009钢制管法兰、垫片和紧固件(法兰选取).pdf VIP
- 中国脱硫脱硝除尘项目商业计划书.docx VIP
- 国家电网有限公司营销现场作业安全工作规程(试行).docx VIP
- 全科医生转岗培训考试(理论考核)题库及答案(2025年深圳).docx VIP
- 手工贴标工艺培训.pptx
- 电梯(困人)机房救援说明.doc VIP
- Power BI数据分析与可视化案例教程.pptx
- 建设法规测验.doc VIP
文档评论(0)