- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web长期保存的困扰研究-图书情报专业论文
万方数据
万方数据
学位论文原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研 究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集 体,均已在文中以明确方式标明。本声明的法律责任由本人承担。
学位论文作者:
日期: 年 月 日
学位论文使用授权声明
本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。
根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部 门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州 大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、 缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学 位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑 州大学。保密论文在解密后应遵守此规定。
学位论文作者:
日期: 年 月 日
摘要
摘要
摘要
20 世纪 90 年代,随着互联网和信息技术全球范围内的飞速发展,web 信息资 源数量日益增加,由于 web 信息资源自身的特点,其“丢失”的速度也很快。随 之而来,造成 web 长期保存在发展过程中经历众多困难及问题。
本文首先对 web 存档的时代背景、概念、关键性措施及必要性等方面进行 详细介绍;其次,对当前流行的 web 存档软件一一进行讲解,分别从 web 存档 系统、网络爬虫、访问、搜索、第三方服务、其他选择等方面深入分析,并指 出相关的优缺点。由此对我们当前面临的困境一一探讨并分析,web 长期保存既 存在管理方面的困扰,也存在技术方面的困扰。技术方面的困扰包括网页采集 工具的局限性、web 存档的真实性、时间一致性、存档格式的有效性,管理方面 的困扰包括存档的合法性、存档内容的选择、恶意软件的去留、网页的去重。 另外,特别强调集体贡献型网站在存档过程与传统结构化网站相较存在一些特 殊的困扰,包括网站抓取的困扰、产权许可的困难、存档动机的缺失等;再次, 通过对英国档案馆和 IMF 案例进行多方面的分析,其中是从产生背景、协作性、 实施方法、技术解决方案、访问及收藏,六个方面对其在 web 存档的操作过程 进行对比分析;最后,根据查阅资料,结合自身理解分别从统一的领导、法律 实践、采集技术、存档人才素质的构建以及其他方面等等提出相关建议。
关键词:web 存档 数字保存 数字保存质量
I
abstrac
abstract
Abstract
In 1990s, with the rapid development of Internet and information technology in the world, the number of network information resources is increasing day by day, because of the characteristics of Web information resources, its lost speed is also very fast. Attendant, the long-term preservation of Web in the development process has experienced many difficulties and problems. The Long-term preservation of webhas many difficulties in the process of development. The confusion in management includeslegality of preservation, selection of web sites in preservation, removing or keeping off viruses and malware, and web page de-duplication. The confusion in technology includes limitation in web harvesting tools, authenticity of web preservation, temporal coherece,and validity of preservation format. In addition, the preservation for web sites in collective contribution has some special confusion, including site scraping,
您可能关注的文档
- UV-固化聚氨酯丙烯酸酯纳米杂化涂料的合成、固化反应动力学与性能-高分子化学与物理专业论文.docx
- UVA对球型脂质膜模型内质粒DNA环状结构的破坏-生物医学工程专业论文.docx
- UVA照射对黑腹果蝇生物学特性和抗氧化反应的影响-农业昆虫与害虫防治专业论文.docx
- UVB对人上皮细胞损伤作用的实验研究-流行病与卫生统计学专业论文.docx
- UV光固化水性木器涂料的制备与性能研究-材料工程专业论文.docx
- UV光固化水性聚氨酯的合成及在静电植绒上的应用-纺织化学与染整工程专业论文.docx
- UV凹印磨砂油墨的研究-教育技术学专业论文.docx
- UV固化固相微萃取新型涂层的开发和应用-应用化学专业论文.docx
- UV固化含硅有机无机杂化材料的制备及性能研究-有机硅化学及材料专业论文.docx
- UVA辐射联合鸦胆子苦醇诱导人恶性黑色素瘤A375细胞凋亡的研究-生物学专业论文.docx
- Web链接结构挖掘中HITS算支的分析与改进-计算机应用技术专业论文.docx
- Web记录自动抽取与去重方法的研究与实现-计算机软件与理论专业论文.docx
- Web页面分块技术的研究与实现-计算机技术专业论文.docx
- Web页面用户评论信息抽取技术研究-计算机应用技术专业论文.docx
- Web页面加载性能监测平台的设计与实现-通信与信息系统专业论文.docx
- WENGER箱包在中国市场的营销策略研究-工商管理专业论文.docx
- Weka平台下电商系统的决策算法研究-信息与通信工程专业论文.docx
- Weinreb酰胺和卤代烃的“一锅法”反应研究及其产物在不对称三氟甲基化反应中的应用-有机化学专业论文.docx
- WEO全球环境治理的模式选择研究环境与资源保护法学专业论文.docx
- WEPP模型(坡面版)在紫色土区域高速公路边坡水土流失中的应用-安全工程专业论文.docx
文档评论(0)