2010第5章网络信息检索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 网络信息检索;本章主要教学内容; 5.1 网络信息检索概述;未来生活 也许网络不会“杀了”我们的身体 但它已经“杀了” 我们现有的生活方式;网络信息资源 ;;网络信息资源的特点;网络信息资源类型 ;网络信息资源类型 ;网络信息资源类型 ;网络信息资源类型 ;FTP信息资源;网络信息资源类型 ;网络信息资源类型 ;网络信息检索的一般方法 ;网络信息检索的一般方法 ;网络信息检索的一般方法 ;网络信息检索技术 ;1、布尔逻辑检索 :;网络信息检索技术 ;网络信息检索技术 ; 网络检索中常用的字段有: title/t:题名字段,表示查找标题中包含检索提问式的页面; subject:主题字段,表示查找主题中包含检索提问式的页面; text:文本字段,表示文本中包含检索提问式的页面; author:作者字段,表示查找作者中包含检索提问式的页面; keywords:关键词字段,表示查找关键词中包含检索提问式的页面。 此外,搜索引擎还提供了带有典型网络检索特征的字段限制类型,如主机名限制(host),URL限制(url),E-mail限制(from),新闻组限制(newsgroups),Link限制(link),网址限制(site)等。这些字段限定了检索词在记录中出现的位置,用来控制检索结果的相关性。;网络信息检索技术 ; ③ 括号:其作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。 例如,检索式“多媒体 and (计算机 or 网络)”,表示要求先执行括号中的“or”运算,再执行括号外的“and”运算。 ④ 引号:其作用是括在其中的多个词被当作一个短语来检索。 例如,检索式“electronic magazine”,表示把electronic magazine当作一个短语来搜索。如果不加引号,搜索引擎就会把两词之间的空格按“与”处理,查出包含electronic和magazine的页面,结果会与用户要求的主题内容相差甚远。 ;5.2 网络信息检索工具 ——搜索引擎;搜索引擎趣闻;搜索引擎概述;全球搜索引擎用户搜索数 ;   所谓搜索引擎(search engine),是指WWW环境中能够进行网络信息的搜集、组织并能提供查询服务的一种信息服务系统。 搜索引擎是通过自己的算法规则对互联网上的信息资源进行采集,组织,管理,存储,然后提供一种直接面向信息查询使用者的服务,并且它能通过对用户查询字串的理解分析,给用户最想要的或最相关信息,帮助人们在茫茫网海中搜寻到所需要的资料。 ; 围绕网络信息检索服务,先后出现过以FTP服务器中特定文档为查询对象的Archie检索服务、基于菜单的Gopher信息检索、基于关键词的Wais文档检索,直到1994年作为世界上第一个基于www服务器的搜索引擎——WebCrawler的问世。自此,搜素引擎成为了主流的信息检索服务系统和检索工具。 ;搜索引擎的雏形 蒙特利尔大学学生Alan Emtage等人在1990年发明的Archie算是现代搜索引擎的雏形。;搜索引擎的分类; 全文搜索引擎,也有人称为索引式搜索引擎,它是我们使用的最为广泛的搜索引擎,是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。这类搜索引擎的服务方式是面向网页的全文检索服务。; 目录式搜索引擎主要通过人工发现信息,并依靠标引人员的知识进行甄别和分类,由专业人员手工建立关键字索引,建立目录分类体系。用户在利用目录式搜索引擎时,可进行浏览查询,从最高层目录开始,逐层深入,直到找到所需的信息为止;也可进行关键词检索。国内的搜狐、新浪、网易搜索也都属于这一类。 ;; 元搜索引擎又称为集合式搜索引擎,是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of search engines)”。它是一种要调用其它搜索引擎的搜索引擎。它接收一个查询请求后,转交给其他若干个独立的搜索引擎处理,最后将多个搜索引擎的搜索结果进行整合后返给查询者。;;;;搜索引擎的使用技巧;查询词的主题关联与简练 ;找问题解决办法;例如,我们上网时浏览器默认主页被修改并锁定。我们应该怎样搜索问题的解决办法呢? 首先不要用自然语言。比如,有的人可能会这样搜索“我的浏览器主页被修改了,谁能帮帮我呀”。网上和这样的话完全匹配的网页,几乎就是不存在的,得不到想要的结果。 这个问题中的核心词汇。对

文档评论(0)

开心就好 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档