32搜索引擎检索汇编.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
32搜索引擎检索汇编

概 念   搜索引擎泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。 搜索引擎Internet 用户 搜索引擎 用户界面 数据过滤 物理 数据库 信息标引 信息搜集 Internet 检索请求 结果显示 关键词 检索结果 网页匹配和分类 网页 分类和说明 Internet信息检索过程 搜索引擎的分类 (按工作方式或检索机制划分) ?目录式搜索引擎:以人工或半自动方式收集信息,按某种分类法进行加工整理。 Yahoo!、Galaxy、Open Directory…… Shou(搜狐)、Sina(新浪)…. ?索引式搜索引擎:机器人搜索引擎或关键词搜索引擎。 Google、百度、天网……. ?元搜索引擎 将多个搜索引擎捆绑在一起,提供统一的检索界面。 分为:并行式元搜索引擎和串行式元搜索引擎。 元搜索引擎一般没有自己独立的数据库,更多的是提供统一联接界面,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟整体,用户通过元搜索引擎的功能实现对这个虚拟整体中各独立搜索引擎数据库的查询显示等一切操作 如:MetaCrawler、Mamma 搜索引擎的分类 (按工作方式或检索机制划分) 目录式搜索引擎代表 Yahoo分类目录(/dir) 1994年,由斯坦福大学的两位学生最先创建。雅虎是中国最著名的目录索引,是搜索引擎开山鼻祖之一。 它收录了全球资讯网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,都可以在这里找到。 高级检索 ?检索途径 通过分类目录、关键词检索 ?检索方法与技巧 支持布尔逻辑检索(不支持“OR” )、可以使用引号,强调“+”、“-”。 ?检索结果 根据关联程度排序 新浪分类目录() 1998年创立,新浪的分类目录将资源分为18大类,1万多个细目。采用主题与学科相结合的分类原则。提供十万个网站的网址、网页、新闻、图片、音乐、地图等资源的查询服务。 目录式搜索引擎代表 教育就业---高校人才--- 就业相关信息 索引式搜索引擎代表 Google公司由斯坦福大学博士生于1998年组建,公司提供的核心服务就是搜索引擎。 Google以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索引擎的领军人物。 ?检索方法与技巧 1、模块分类、关键词检索 2、不支持AND、OR和“*”等符号的使用,自动带有AND的功能,不支持“OR”查找,用户需要查找两种不同的信息,需要分开检索。 3、词与词之间空格表示逻辑“与”。 如进行石油与天然气方面信息的搜索,可输入“石油 天然气” 加“-”表示逻辑“非”, “-”前面要加空格。 如检索“color –colour”,注意color后有一空格,而colour前没有空格。 4、忽略助词或冠词 5、若要做精确检索,用“ ”把检索词括起来。 查找color而非colour ?检索特色 网页快照、手气不错 相似网页、查询电话号码、查找PDF文件、股票报价、查找字典释意、用Google查找地图、工具条服务、网页翻译、单词纠错、繁简转换 索引式搜索引擎代表 百度是国内最早的商业化全文搜索引擎,1999年由李彦宏和徐勇在美国硅谷创建,2000年百度回中国发展。中国提供搜索引擎的主要网站中,超过80%由百度提供,提供搜狐、新浪、263、TOM等站点的搜索服务。 ?检索方法与技巧 模块分类、关键词检索 要求“一字不差”,支持布尔逻辑检索(可以用空格代替 AND/+) 可以使用检索语法 ?检索特色 百度快照、自动纠错、百度搜霸 百度与google比较 搜索英文不必说用google,搜索中文呢? 很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,百度发展相对迟,信息较新。 更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不再搜索。百度的更新较快,半月一次,最快一周。 百度和google语法的应用 1、找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT等文件类型,这些文件名都是网友想找的重点,用google去搜索。方法是利用语法filetype:后缀名。 如找PDF文件,在正常关键词后面加filetype:PDF即可,搜索结果全是PDF文件。 2、找特定题目的网页语法intitle:网站 如在百度查找维普数据库的网页可用: intitle:维普中文全文数据库 3 、查找友情链接: link:(英文单字link后加冒号)用于搜索链接到某个URL地址的

您可能关注的文档

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档