第三讲搜索引擎高.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 搜索引擎 高 凡 必须找? 哪里找? 如何找? 本讲主要内容 3.1 搜索引擎的定义、原理、分类 3.2 Google及其使用技巧 3.3 其它搜索引擎 3.1.1 搜索引擎的定义 搜索引擎是一个提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 搜索引擎常常是用户利用网上资源的第一途径。 3.1.2 搜索引擎原理 从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 大多数搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 3.1.3 搜索引擎的分类 按检索机制划分 按检索内容划分 按数据来源划分 (1)按检索机制划分 全文搜索引擎 目录式搜索引擎 元搜索引擎 全文搜索引擎 从互联网上提取的各个网站的信息而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。 优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能。 缺点:繁多而杂乱的感觉。 代表性的全文搜索引擎是Google、百度。 目录式搜索引擎 通过用户浏览层次类型目录来寻找所需信息。 分类一般按主题分类,并辅之以年代、地区等分类。 网站多以此方式组织。例如:新浪分类目录计算机与互联网 硬件行情报价。 优点:使用户清晰方便地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。 代表性的目录式搜索引擎是Yahoo、搜狐、新浪网站 元搜索引擎 同时在其他多个引擎上进行搜索,并将结果返回给用户。 没有自己的数据库,利用一个统一的界面,查询其他独立的搜索引擎。 优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索结果没有经过处理 著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有北斗、等。 MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。 支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。 检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。 高级检索模式可实现:搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)等。以上内容均可作为定制检索的个性化选项并予以保存。 检索结果中包括一个以1000为最大值的相关度指标。 一款理想的元搜索引擎应具备的特点和功能 含盖较多的搜索资源,可随意选择和调用源搜索引擎; 具备尽可能多的可选择功能,如资源类型(网站、网页、新闻、软件、FTP、MP3、图像等)选择、返回结果数量控制、结果时段选择、过滤功能选择等 强大的检索请求处理功能(如支持逻辑匹配检索、短语检索、自然语言检索等)和不同搜索引擎间检索语法规则、字符的转换功能(如对不支持“NEAR”算符的搜索引擎,可自动实现由“NEAR”向“AND”算符的转换等 详尽全面的检索结果信息描述(如网页名称、URL、文摘、源搜索引擎、结果与用户检索需求的相关度等) 支持多种语言检索。 (2)按检索内容划分 通用型 专题型 通用型搜索引擎 通用型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为综合型检索工具。如:Google、百度、AltaVista、Excite、Yahoo等也有这种混合功能。右图是Yahoo的检索界面,既有检索窗口,也有分类浏览目录。 专题型检索工具 专题型检索工具指那些专门用来检索某一类型信息和数据的检索工具,如查询地图的检索工具“MapBlast”、查询图像的检索工具“WebSEEK”等。 (3)按数据来源划分 独立搜索引擎 拥有独立的采集标引机制和独立的数据库 元搜索引擎 没有自己的数据库,它利用一个统一的界面,查询其他独立的搜索引擎 3.2 Google及其使用技巧 由两个斯坦福大学博士生Larry Page与Sergey Brin于1998

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档