第3章因特网技术应用精选.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章因特网技术应用精选

张明参加了电视台举办的“百科知识大赛”活动,主持人问:明朝的一位工匠是天安门的第一个设计者,你能说出他的名字是什么吗?张明对此题一无所知。但答题规则中的一条是:如果对某题答案不确定可以请求场外朋友帮助。现在他求助你了,你能在30秒内告诉张明正确答案吗? 注意: 请你记住你解决此问题的详细步骤。 正确答案:蒯祥 一、搜索引擎及其类型 1、搜索引擎定义 从狭义的角度来说,搜索引擎是指对因特网上的站点资源和 其他网络资源进行标引和检索的一类检索系统机制,由信息 收集软件、索引数据库和查询接口三部分组成。 从广义的角度上讲,搜索引擎是指因特网上的一类网站, 它们在万维网中主动搜索信息,搜索网页上有意义的单 词和简短的对特定内容进行描述的词,并将其自动标引 的万维网网站以及标引的内容储存在可供检索的大型数 据库中,并建立相应的索引和目录服务,从而对用户提 出的各种检索要求作出响应,提供用户所需的信息或相 关的链接。 2、搜索引擎类型 搜索引擎按其检索机制主要可分为三种: 全文搜索引擎 目录搜索引擎 元搜索引擎 (1)全文搜索引擎通过用户输入关键词来查找所需的信息资源。 目前代表网站: .hk 关键词的选择 (1)正确使用布尔运算符 AND + 必须同时符合所列关键词 空格 OR 只需符合所列关键词中的一个 | NOT 把含有该关键词的排除在外 — (2)用英文双引号或中文书名号进行精确检索《手机》 既含有“鲜花”又含有“玫瑰” 鲜花AND玫瑰 含有“鲜花”或含有“玫瑰” 鲜花|玫瑰 含有“鲜花”不含有“玫瑰” 鲜花—玫瑰 (4)尝试使用近义词 问题一:如果你想找手机这部电影,你会选择什么样的关键词? (3)避免输入错别字及使用太常见的关键词 问题二:如果想查找关于笔记本电脑一些资料,你认为选择什么样的关键词合适? (2)目录搜索引擎 目录搜索引擎 是把搜集到的 信息资源按照 一定的主题进 行分类,建立 层次目录。 代表网站: (3)元搜索引擎 也称集成型搜 索引擎,它将 用户的检索请 求同时送到多 个引擎上进行 搜索,并将结 果返回给用户。 代表性网站:中国——搜魅网 比比猫 外国——ask 、Dogpile、MetaCrawler 三种搜索引擎的区别 搜索引擎类型 优点 缺点 代表性搜索引擎 全文搜索引擎 全文检索; 检索功能强; 信息更新速度快。 提供的信息虽然多而全,但可供选择的信息太多反而降低相应的命中率,而且提供的查询结果重复链接较多,层次结构不清晰,给人一种繁多杂乱的感觉。 国外:Google Alta Vista 国内:百度 目录搜索引擎 层次结构清晰,易于查找;多级类目,便于找到具体明确的主题;分类目录下有简明扼要的内容,一目了然。 搜索范围小;更新速度慢;查询交叉类目时容易遗漏。 Yahoo, 搜狐、新浪、网易搜索 元搜索引擎 Ask 、Dogpile、MetaCrawler ` 二、搜索引擎工作过程和原理 搜索引擎是一种技术性很高的网络应用系统,它包括网络技术、数据库技术、 自动标引技术、检索技术、自动分类技术。 搜索引擎的组成:信息搜索系统、索引数据库和查询接口 1、搜索引擎的工作流程 搜索引擎的工作流程可归纳为三个步骤: (1)由信息搜索系统在因特网中发现、搜集网页信息 (2)对信息进行提取和组织,建立索引数据库 (3)根据用户输入的查询条件,在索引数据库中快速检出文档, 进行文档与查询的相关度评价,对将要输出的结果进行排序,并 将查询结果返回给用户。 搜集网页信息 建立索引数据库 检索网页,对结果排序 2、搜索引擎的工作原理 (1)全文搜索引擎 全文搜索引擎的信息搜索功能分两种: 一种是定期搜索, 即每隔一段时间搜索引擎主动派出“蜘蛛”程序,对一定 IP地址范围内的网站进行检索,一旦发现新的网站,它 会自动把网站的信息和网址加入到自己的数据库中。 另一种是提交网站检索 网站拥有者主动向搜索引擎提交网址,它在一定时间内定 向向用户提交的网站派出“蜘蛛”程序,扫描网站并将有关 信息存入数据库,以备用户查询。 全文搜索引擎主要采用关键词索引技术,其索引程序生成 从关键词到超文本链接的索引表。 注:“蜘蛛”程序或“机器人”程序,可以被描述为“一个在网络 上检索文件且自动跟踪该文件的超文本结构并循环检索被参 照的所有文件的软件”。 (2)目录搜索引擎 全文搜索引擎属于自动网站

文档评论(0)

586334000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档