- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息资源自动化采集技术方案策划;;网络信息资源的特点;质量参差不齐
网络信息资源具有不同的层次与效用,既有科学前沿的研究报告,也有大众通俗读物;既有已经整理的信息,也有无序的原始信息;既有较大参考价值的信息,也可能混有毫无用处的“信息垃圾”,甚至还有不少有害的信息。信息质量参差不齐,利用的价值差异较大。
类型多样
因特网内容包罗万象,覆盖了不同学科、不同领域、不同地域和不同语言。在形式上,包括文本、图像、声音、软件、数据库等。
;动态性
网络信息资源是一个动态系统,许多服务器处在不断的变化之中, 网络信息更新迅速,网页的增加、删除、更新地址经常发生,信息的时效性强。由于网页更新周期缩短,使有关的内容处于一种动态的变化中。这无疑增加了网络信息搜集的难度。
关联程度强
网络信息资源可利用超文本技术,通过超级链接手段,构成立体网状的联系,各个国家、各种服务器、各种网页、各种文章上的相关信息都可以通过结点连接起来,从而直接指导用户去查阅所引用的原始文献。
;图书馆网络信息资源整合方案策划;天津师范大学图书馆网络信息资源的类型结构主要包括网络文本信息资源、网络多媒体资源(视频、音频)、图片等。;网络百科
包括事物的基础名词概念(可只搜集偏学术的概念解释),各个学科的原理、原则、理论等。将几个著名百科网站(百度百科、维基百科)综合汇总,对有异议的进行鉴定。同时可结合文献资料完善不完全的条目。
新闻类
可对一些重要历史时刻的新闻进行搜集,除此之外可提高学术类新闻的重视,如重大学术突破、科技创新、新理论的推出等。
;零次信息
零次文献也称灰色文献。是指介于公开发行的白色文献与不公开发行的保密文献之间的既不公开发行、又不是保密的文献。主要包括政府的行政报告与科技报告、高校、科研院的内部刊物、专家学者的手稿、学术会议资料、社会调查报告等等。这些文献具有信息新、质量高、专业性强,同时信息量大、种类多、涉及面较广。
标准类
对国家发布的行业标准、或企业内部发行的标准进行等汇总。(只在内部使用是否侵权?)
;开源网络信息资源
开放获取资源是指通过互联网在线访问、永久免费阅读、下载、复制、发布、打印、检索,且不受很多版权和许可限定的学术文献和信息资源。?开放获取资源可以简称为“OA资源”(0pen Access)?。??开放获取资源的保存包括所有附件、授权声明在内的完整作品,以适当的标准存储格式存在至少一个仓储中,仓储要由学术机构、学会、政府或其他知名组织设立并管理,以确保作品能够长期持续地开放获取。
开放资源主要有四种表现形式:开放期刊、开放数据、开放仓储、科研博客。
;学术科研博客
博客的思想理念与图书馆的核心精神是一致的,博客的促进交流与共享的特点使得图书馆利用学术博客进行学术信息服务具有很多先天的优势。而图书馆所拥有的文献资源,人才队伍与信息技术也为图书馆应用学术博客提供了物质基础和便利条件。
学术博客这种信息服务方式还有传统图书馆不具备的一些优势,学术博客提供了了现代信息环境下非正式交流的途径,这种可交流的机制调动了用户的积极性与互动性,并且在知识共享的过程中建立了社交关系。
向用户提供博客来源的链接,可以对博主进行关注或者在原文中与博主进行探讨交流。
;可选用类似搜索引擎的信息分类方法,采用多级菜单与数据库结合的方式,将经过选择的网络信息资源分为若干个类目,每个类目下又设若千个子目,其后就是数据库。除此之外还要考虑天津师范大学学科分布情况,可适当删减一些本校不涉及的学科。;网络信息资源搜集方案;自动搜集
自动搜集指用一种网络机器人(网络爬虫)的软件在因特网上漫游,定期地到指定的网站自动搜集网上从了、和站点上的各种相关信息,并且把这些信息存于本站点上,然后再对其进行加、组织和提供服务。
人工搜集
人工搜集信息的工作由网站管理员完成,浏览因特网以及利用政府机关、国内相关机构、相关学术活动与商业活动等进行信息搜集。通过信息搜集,获得该学科或领域有关的研究机构、电子图书、学术期刊、会议论坛、专家学者及其他相关的网址。这种搜集方式的优点是链接站点经人工选择,相关度较高。其缺点是效率较低,难以完整地搜集到相关的。另外,网站管理员还需周期性地检测原有链接是否依然有效,并及时排除“死链”。
;对于新闻类这种时效性强的网络信息资源,为了保障信息的完整性,应设置自动搜集的周期应该短一些。
百科类的网络信息资源再完成一次搜集之后,数据不会出现大范围的更新,但为了完善信息的正确性还需要进行人工介入操作。
对于零次信息类、学术博客类、标准类网络信息资源,可采用人工检索与自动搜集技术相结合。运用自动搜集技术对政府网站、知名学术博客网站进行定期搜集,并由网站管理员对这部分网络信息资源手动进行补充。;如何在宽泛的网络信
您可能关注的文档
- 第六章粘性流体管内流动详解.ppt
- 第二讲动态规划讲述.ppt
- 第二讲三大悲剧家讲述.ppt
- 第二讲学科体系:世界近代史的三个发展阶段讲述.docx
- 第二节:通过激素的调节讲述.pptx
- 第二讲咳嗽与咳痰讲述.ppt
- 第二讲变量、数据文件、系统参数讲述.ppt
- 第六章脂类代谢2015详解.ppt
- 网络音视频资源获取与处理详解.pptx
- 第二讲对国家早期探索讲述.ppt
- 滋养细胞疾病妇女的护理.pptx
- 关于培养良好习惯的演讲稿(23篇).docx
- 大学生社会实践调研策划书(14篇).docx
- 农民工工资管理制度(13篇).docx
- 把世界好给女性品牌素材ys digital 2015.pdf
- 附件一别墅弱电智能化设计顾问任务书-扩标7ne3e.pdf
- 参考介绍规格pxie-4357ni.pdf
- w04a third party cyber security data loss prevention finaldsp三方数据丢失预防.pdf
- id状态源段目标翻译批准cmiot fundamentals校对.pdf
- 作者jamie margaret插图nick diggory多么棒旅行啊harcourt reading grade p.pdf
文档评论(0)