- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[第五章文献检索
第五章 网络信息利用原理 5.1 网络信息资源 5.1.1 定义 广义:网络信息资源是在网上以各种方式存在并传播的信息集合。如:网上计算机中的无数信息、网上的各种信息工具以及网络通信渠道。 狭义:网络信息资源通常指公网上的信息资源,即访问不受任何限制的信息资源。 5.1.2 特点 1,数量庞大,增长迅速 2,整体无序,局部有序 3,更新频繁,变化无常 4,多维显示,交互方便 5,良莠混杂,参差不一 5.1.3 网络学术信息资源的类型 网络学术信息是指与学术有关的网络资源,具有学术价值。 按内容分: 一,网上传播的学术机构信息,如学会、协会、研究所等信息; 二,学术人物信息,包括学科专家、学术研究带头人的有关信息; 三,科研信息,包括科研课题、科研项目的立项、申报、课题的进展、结题报告等信息; 四,科研成果信息,包括发表的论文、出版的著作、课题报告等信息。 按出版类型分,网上学术信息资源有着和纸质型出版物类似的对应关系。比如,纸质型的期刊有网络期刊与其对应,纸质型图书有网络图书与其对应,只执行的报告有网络报告与其对应等等。 按是否具有原创性 一次资源:首次发表的原创性信息; 二次资源:转载已有的信息或者是从原创信息中提取的部分信息 按是否经过审核: 正式出版物,学术价值相对较高,或标有ISBN,或者标有ISSN,或者是权威学术机构的出版物。 非正式出版物,具有明显的个人行为性质,学术价值变化较大。 按是否属于搜索引擎检索范围可分为不可见资源和可见资源两类。 网上的不可见资源的数量远远大于可见资源。 5.1.4 人文社会科学学术网站 1.网页,网站和主页 网站有若干个相关网页组成的一个站点,有独立的域名。一般情况下,每个网站都有一个主页(homepage),它的作用是引导访问者浏览网站。 2,人文社会科学学术网站的类型 (1)按信息内容特征区分,包括综合性、专科性社会科学学术网站; (2)按网站的主办机构区分,学术网站有个人网站、杂志社网站和科研机构网站三类。 (3)按网站功能区分,人文社会科学类的学术网站可以分成学科门户、学科资源和论坛博客三类网站。 5.2 网络信息检索工具和检索方法 5.2.1 网络信息检索的相关概念 1,IP地址和域名 因特网协议(Internet Protocol)地址,通称IP地址,是每台上网计算机都必须有的网上地址。 域名(Domain Name, 简称DN)一般由通信协议、主机名、机构性质域名和国家域名四个字段构成。 2 网址 网址,又称统一资源定位器(Uniform Resource Locator,简称URL), 代表了网上一切资源,包括上网计算机及其各种文件的地址。网址是由域名加文件地址构成。 5.2.2 搜索引擎的基本概念 1,定义 搜索引擎(Search Engines)是网上信息搜索工具的通称。它可以是独立的门户网站,如谷歌,也可以是附在其他类型网站上或主页上的一个搜索工具。 2,类型 目前网上的搜索引擎数以千计,他们可以按照工作方式、工作语种和检索内容分成若干类型。 (1)按工作方式区分。可分为主题引擎、目录引擎和多元引擎。 1)主题引擎。其特点是信息的收集、处理和提供过程完全由程序自动完成,处理信息的层次是网页,检索所得结果的网页中通常含有检索词。 主题引擎的优点是信息量大、更新及时、无需人工干预,缺点是返回信息中常有很多无关信息,甚至有一定比例的死链接。 主题引擎有搜索软件、索引软件和检索软件构成。 2)目录引擎。又称目录指南型搜索引擎。这种引擎的信息收集和处理由人工干预过程,信息处理的层次为网站,检索所得结果的网页中不一定含有检索词。 主题引擎和目录引擎的最主要区别在于有无人工处理信息过程。 目录引擎的信息因为由人工处理过程,所以死链接较少、信息准确、导航质量高,缺点是需要人工介入,维护量大,信息量少,信息更新不及时。 3)多元引擎。又称元搜索引擎。多元引擎本身没有存放网页信息的数据库。它的服务方式为面向网页的检索。 少而精是多元引擎的检索结果的特点,这是很多互联网用户喜欢使用这种引擎来查找信息的原因。它的缺点是访问的搜索引擎数量少,而且不支持这些搜索引擎的高级搜索功能,在处理逻辑查询时也常常会出现错误。 常用搜索引擎简介 Google 百度 Google scholar SCIRUS Scitopia 读秀 百度 百度的起名,来自于“众里寻她千百度”的灵感。 Baidu(百度)是目前全球最优秀的中文搜索引擎。中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提供搜索引擎技术支持,现有客户包括新浪、 Chinaren、腾讯、263、21cn等。 1999年底,百度由李彦宏和徐勇创立于美国硅谷,2000年百度公
文档评论(0)