第5章网络信息检索概论-贵州大学.PPT

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章网络信息检索概论-贵州大学

2、基本检索(简单检索) 它是索引式搜索引擎,用户在搜索框中输入检索词,搜索引擎会返回一组指向相关站点的超级链接。它往往对检索提问式的构造要求较低,比较直观,检索过程相对简单。 检索结果 6570000 3、高级检索 高级检索:往往需要用户按照搜索引擎检索的语法规则,自行构造完整的检索式(在基本检索界面),或将检索词输入到相应的检索框中。 (在高级检索界面)。 高级检索界面: 如:“公务员考试模拟试题” 公务员考试模拟试题 输入检索式 输入检索词 两种输入方式的检索结果 110000 又如:在标题中检索 “完整关键词” 104000 Title:“公务员考试模拟试题” 又如:google 4、地区检索 A.通过“虚拟旅游者”检索信息 “虚拟旅游者”(The Virtual Tourist)是按地区访问WWW的超文本页面,不便提供文字说明,配备含链接的世界地图。通过使用鼠标点击世界地图的不同部分,用户可能非常直观地进行按地区检索信息。它的URL地址为:http://WWW./webmap/。 B.通过Gopher检索信息 许多Gopher服务器都提供按地区检索信息的功能。可以通过URL地址的Gopher服务器按地区检索信息: C.用搜索引擎提供的地区(图)搜索检索 如google提供的“地图”查询,中搜的地图搜索等等。。 第四节 网络信息检索 网络信息检索概念 网络信息检索工具的类型 网络信息检索技巧 一、网络信息检索概念 网络信息检索——指网络信息按一定的方式存储起来,用科学的方法,利用检索工具,为用户检索、揭示、传递知识和信息的过程。 广义的网络信息检索包括网络信息整序和搜寻,整序是对网上的知识和信息进行加工,按学科、主题或字顺等方式排序,形成检索工具或检索系统; 狭义的就是网络信息搜寻,指利用相应的检索工具或检索系统,运用科学的方法,从有序的信息集合中查出所需信息的过程。 二、网络信息检索工具的类型 按不同方式可分为不同类型: 1、按检索资源的类型分: (1) 非Web资源检索工具 即以非Web资源(如:FTP,Gopher,Telnet,Usenet等)为检索对象的检索工具,如:Archie,Veronica,WAIS等。 (2) Web资源检索工具 即以Web资源为主要检索对象,又以Web形式提供的检索工具 。 2、按检索时所包括的检索工具数量分 ① 独立型(单一)搜索引擎:它拥有自己的索引数据库,提供基于自身索引库的查询,如Yahoo! 搜狐、google等 ②集合型搜索引擎(元搜索引擎):它没有自己的索引数据库,只提供集成的查询界面,典型的有:3721、Metasearch,MetaCrawler,Bytesearch等. 3、按索引方式分 目录型搜索引擎:主要采用人工或机器搜索信息,由人工对信息进行分类加工整理,建立分类导航或分类编排网站目录,提供分类检索的引擎,如搜狐、 全文型搜索引擎:又称索引型搜索引擎,由索引软件自动搜索信息,建立网页信息索引库提供全文检索,如百度,google等 三、网络搜索引擎的检索技巧 限定在网页标题中——intitle,title,或t:把查询内容中特别关键的部分,用“intitle:”领起来。 例如,找林青霞的写真,可以写成:写真 intitle:林青霞 2、限定在特定站点中——site 格式是:“查询词 site:站点域名”。 如,查“sina中旅游方面的资料”,可以输入:旅游 site:注意,“site:”后面跟的站点域名,不要带http://. 3、限定在url链接中——inurl 格式是“inurl:关键词”或:“url:关键词”。 如,找关于“photoshop的使用技巧”,可以用:photoshop inurl:jiqiao,查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。 注意:intitle: site: inurl:和后面所跟的关键词(或站点)不要有空格。 4.精确匹配——双引号和书名号 A、双引号——可以达到让搜索引擎不拆分查询词。 如,搜索“贵州大学农学院”, B、书名号: 一是书名号会出现在搜索结果中; 二是被书名号扩起来的内容,不会被拆分。通常用于查名字很通俗和常用的电影或者小说。 如,查电影《手机》, 5.根据特征选择查询词 如(1)找论文 查找“烟草栽培方面的期刊论文” 1) 输入: 主题词+文档格式(PDF,DOC等),如filetype:pdf title: ( 烟草栽培 ) 2) 由于一般的论文,都有一定的格式,除了标题、正文、附录,还需有论文关键词,摘要等。其中, “关键词”和“摘要”是论文的特征词汇。而论文主题,通常会出现在网页标题中。因此,可以输入:

您可能关注的文档

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档