第七讲搜索引擎简介及使用技巧.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七讲搜索引擎简介及使用技巧

WWW信息资源 搜索引擎的工作原理 搜索引擎的类型 目前搜索引擎提供的主要 检索路径 搜索引擎举例 万维网(WWW)由欧洲粒子物理研究中心于20世纪90年代初期发明。由于其能够方便迅速地浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息,因而得到迅速发展。 小 结 互联网信息资源总量继续保持快速增长,数据更新周期缩短; 在线数据库对信息资源的整合与共享优势得到认可; 免费资源丰富,在拥有在线数据库的网站中,免费数据库达87.7%; 人们越来越多地使用在线数据库来进行信息检索与挖掘,从而提高了网上资源的开发利用率。 搜索引擎的工作原理 在WWW站点迅速增加的同时,出现了检索万维网信息资源的搜索引擎技术,并以此构造检索所有各类网络信息资源的集成化支撑体系。 搜索引擎指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制。 搜索引擎一般包括数据采集标引机制、数据组织机制、用户检索机制。 搜索引擎工作原理示意图 搜索引擎的类型 网络检索工具按照不同的划分方法,可分为许多不同的类型。 按索引方式可分为:目录型搜索引擎、索引型搜索引擎。 按检索时搜索的检索工具数量可以分为:独立型搜索引擎、集合型搜索引擎。 按检索网络资源的类型可分为:Web资源检索工具、非Web资源检索工具。 目 录 型 搜 索 引 擎 主要采用人工或机器搜索信息,由人工对搜集的信息进行甄别、分类、加工建立分类导航或分类编排网站目录,提供分类检索的引擎,如搜狐、雅虎等, 提供族性检索模式,符合人们从分类角度检索信息的习惯。 目录型搜索引擎对网上信息的分类清晰明确、条理性强,类目设置基本反映人们关注的主要问题。但因人工分类成本高、费时费力,标引速度慢,故这类引擎的及时性不强、信息量不大. 索 引 型 搜 索 引 擎 主要采用搜索软件自动搜索信息,建立网页信息索引库提供全文检索,用户在检索框中输入关键词/词组进行检索,这类搜索引擎如天网、网络指南针等, 主要提供特性检索,适于检索专指性较强的问题。 索引型搜索引擎及时性好、信息量大。 独 立 型 搜 索 引 擎 也称单一搜索引擎,它拥有自己的索引数据库,提供基于自身索引库的查询服务,如雅虎、搜狐、Google等。 集 合 型 搜 索 引 擎 是多个独立型搜索引擎的组合,也称多元搜索引擎、元搜索引擎,一般说来,它没有自己的索引数据库,只提供集成的查询界面;它将用户的检索请求处理后提交给多个事先选定的独立型搜索引擎,并将各引擎的搜索结果处理后集中显示给用户,如3721智能搜索等。 Web 资 源 检 索 工 具 是以Web资源为检索对象,按其搜集信息的内容又可分为:综合性的搜索引擎和专题性的搜索引擎。 综合性的搜索引擎广泛收集网上各个学科、专业的信息,包括科学、人文、生活、社会、新闻、休闲、娱乐等各方面信息,如“Google”、 “搜狐”等。 专题性搜索引擎只收录网上某一专业领域的信息,如“眼科搜索”、“图行天下”等,前者只收录眼科方面的信息;后者只收录地图信息。 非Web 资 源 检 索 工 具 如查找新闻组、FTP资源、检索电子邮件列表等。随着Web资源的迅速发展,非Web资源检索工具正在逐步Web化,使Web资源检索工具成为检索网络信息资源的集成化工具。 目前搜索引擎提供 的主要检索路径 目前一般搜索引擎提供的检索路径有: 1)目录与关键词检索相结合。 如“搜狐” 。 2)精确检索。如用受控词表。 3)自然语言检索。 4)多语种检索。 用户可以在检索结果中限制检索结果的语言,有些还提供检索结果的自动翻译服务。 目前搜索引擎提供的 主要检索路径 5)多媒体检索   多媒体检索包括基于描述的多媒体检索和基于内容的多媒体检索。基于描述的多媒体检索就是用一个关键词来描述所要查找的图片或是音乐,基于内容的多媒体检索就是用一些视觉特征来查找多媒体信息,这些视觉特征包括颜色、形状、纹理等。 6)过滤检索   在检索中自动将一些网站信息过滤去掉。 目前搜索引擎提供的 主要检索路径 7)智能检索   检索系统能够自动地分析检索结果,为用户提供最满意的信息。 8)检索结果修正   在上一次检索结果的范围内调整检索方案,以期达到更精确的相关信息。 9)检索结果排序   自动分析查询到的页面,将相关性最大的网页排在前面。 10)提供最新收录的新站 搜索引擎举例 搜索引擎举例(一) 雅虎(/) 1994年问世,世界上最早开发、最受欢迎的目录型搜索引擎之一。主要用于检索Web网页、网站、新闻组、FTP等资源。 主题分类详细,共分为14个大类,下分子类,最

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档