浅析搜索引擎.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析搜索引擎.pdf

CST 浅析搜索引擎 彭轲 廖闻剑 (武汉邮电科学研究院,湖北武汉 430000 ) 摘 要:介绍了搜索引擎的概念、分类、原理、组成结构、基本工作方式和流程,对现今搜索引擎中所使用的技 术进行初步的比较和分析,并对将来的研究方向进行了展望。 关键词:搜索引擎;检索;索引 The Analysis of Search engine Peng Ke Liao Wenjian (Wuhan Research Institute of Posts Telecommunications Hubei Wuhan 430000 ) Abstract :In this paper, we illustrate the basic concepts, category, principle and architecture of the search engines.Then search engines’ technology which was used nowadays will be compared and analyzed. And a prospect to the future study will be made at last. Keywords:Search engine; Search; index. 1 引言 在这个信息爆炸的时代,从网络上寻找自己所需要的信息越来越离不开搜索引擎,这种快捷而便利的方式已 越来越受人青睐,而 Baidu ,Google,Yahoo 等搜索引擎的成功标志着搜索引擎已不再是 IT 人士才懂的专有名词。 搜索引擎带给我们的庞大的信息量和便捷的操作使得复杂的互联网高维网状结构简化为平面,平面的中心是信息 的使用者,各种信息触手可及。 由于搜索引擎公司 Google 上市的刺激,使得各方开始认真思考搜索的意义,从而使得搜索引擎研究成为学 界较为热门的研究话题。 2 什么是搜索引擎 搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称网络搜索机器人) 或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种 查询作出响应。目前网上的搜索引擎模式为获得信息——整理,建立数据库——提供查询。网络搜索引擎一般都 有其后台数据库,连接方法多样,可以通过 CGI 实现客户端与服务器端的交互,或使用 Active 数据库控件实现 WEB 与数据库的连接。 CHINA SCI-TEC 2008.01 — 1193 — CHINA SCI-TEC 3 搜索引擎的分类 3.1 按搜索范围划分 按搜索范围划分因特网上的搜索引擎可分为两大类。第一类是全文检索(Full text search )的搜索引擎,用 户能够对各网站的每个主页中的每个词进行搜索。全文搜索引擎的优点是查询全面而充分。当全文搜索引擎遇到 一个网站时,会将该网站上所有开放的网页全部获取下来,并收入到引擎的数据库中。只要用户输入查询的“关 键字”在引擎库中的某个主页中出现过并且最贴近关键词,则这主页就会作为匹配结果优先返回给用户。全文检 索真正提供了用户对 Intemet 上所有信息资源进行检索的手段,给用户以最全面最广泛的搜索结果;第二类是建 立在分类学基础上的目录分类式搜索引擎。它通过人工方式将所收入的站点进行分类而建立数据库,以提供查询。 目录分类式搜索引擎当遇到一个网站时,先将该网站划分到某个分类下,再记录一些摘要信息该网站进行概述性 的简要介绍。用户提出搜索要求时,搜索引擎只在网站简介中搜索。分类搜索引擎的优点是将信息分门归类,用

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档