32搜索引擎检索解决方案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎Internet 搜索引擎的分类 (按工作方式或检索机制划分) ?目录式搜索引擎:以人工或半自动方式收集信息,按某种分类法进行加工整理。 Yahoo!、Galaxy、Open Directory…… Shou(搜狐)、Sina(新浪)…. ?索引式搜索引擎:机器人搜索引擎或关键词搜索引擎。 Google、百度、天网……. 搜索引擎的分类 (按工作方式或检索机制划分) ?元搜索引擎 将多个搜索引擎捆绑在一起,提供统一的检索界面。 分为:并行式元搜索引擎和串行式元搜索引擎。 元搜索引擎一般没有自己独立的数据库,更多的是提供统一联接界面,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟整体,用户通过元搜索引擎的功能实现对这个虚拟整体中各独立搜索引擎数据库的查询显示等一切操作 如:MetaCrawler、Mamma 目录式搜索引擎代表 Yahoo分类目录(/dir) 1994年,由斯坦福大学的两位学生最先创建。雅虎是中国最著名的目录索引,是搜索引擎开山鼻祖之一。 它收录了全球资讯网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,都可以在这里找到。 高级检索 新浪分类目录() 1998年创立,新浪的分类目录将资源分为18大类,1万多个细目。采用主题与学科相结合的分类原则。提供十万个网站的网址、网页、新闻、图片、音乐、地图等资源的查询服务。 教育就业---高校人才--- 就业相关信息 索引式搜索引擎代表 Google公司由斯坦福大学博士生于1998年组建,公司提供的核心服务就是搜索引擎。 Google以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索引擎的领军人物。 查找color而非colour 索引式搜索引擎代表 百度是国内最早的商业化全文搜索引擎,1999年由李彦宏和徐勇在美国硅谷创建,2000年百度回中国发展。中国提供搜索引擎的主要网站中,超过80%由百度提供,提供搜狐、新浪、263、TOM等站点的搜索服务。 百度与google比较 搜索英文不必说用google,搜索中文呢? 很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,百度发展相对迟,信息较新。 更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不再搜索。百度的更新较快,半月一次,最快一周。 百度和google语法的应用 1、找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT等文件类型,这些文件名都是网友想找的重点,用google去搜索。方法是利用语法filetype:后缀名。 如找PDF文件,在正常关键词后面加filetype:PDF即可,搜索结果全是PDF文件。 基本搜索语法——查找文件 2、找特定题目的网页语法intitle:网站 如在百度查找维普数据库的网页可用: intitle:维普中文全文数据库 3 、查找友情链接: link:(英文单字link后加冒号)用于搜索链接到某个URL地址的网页。可以了解有哪些网页把链接指向您的网页。 基本搜索语法——查找站点 4、“site:”表示搜索结果局限于某个具体网站 如搜索包含“金庸”和“古龙”的中文新浪网站页面 金庸 古龙 site: 但不可加入http://或/这类,否则是错的。 Site可将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率 。如keywords site:edu,效果很好!可以方便地搜索到各大学内有用的资源。 查找教育网上关键词为大学生就业的PDF文件 搜索:“大学生就业 filetype:pdf site:edu” 结果:搜索到67项相关内容 基本搜索语法——查找站点 用“site:”可定位于国家或地区,将搜索局限于某些国家或地区,或加上edu,则是这些国家或地区的大学,效果自然更好。 site:tw, site:edu.tw, site: ....... 大学生 就业 site:edu.tw 5、“inurl:”表示搜索的关键词包含在指定的URL链接中 示例:查找MIDI曲“沧海一声笑”。 搜索:“inurl:midi 沧海一声笑” 结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页 注意:“inurl:”后面不能有空格 6、相关网页搜索“related” related用来检索结构内容方面相似的网页。 例如搜索与偶游在线类似的网页,可以用关键字“related: ”来寻找类似的网页 google其它功能 —翻译功能 google其它

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档