搜索引擎技术内核介绍.docVIP

  • 11
  • 0
  • 约2.99千字
  • 约 10页
  • 2017-08-15 发布于重庆
  • 举报
搜索引擎技术内核介绍.doc

搜索引擎技术内核 班级:07信管本(2)班 姓名:于振业 学号:45 搜索引擎简介: 搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录方式,将Internet上大量网站的网页信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。目前,我国互联网中主要的搜索引擎有Google、百度、Bing、有道、搜狗等等。百度和Google的用户相对较多。以后还会有更多专业的搜索出现 用户检索途径主要包括: a.自由词全文检索 b.关键词检索 c.分类检索 d.其他特殊信息检索 搜索引擎的技术性分类: 全文搜索引擎 全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到

文档评论(0)

1亿VIP精品文档

相关文档