网络信息检索技术概述.docVIP

  • 7
  • 0
  • 约4.77千字
  • 约 4页
  • 2018-02-24 发布于河南
  • 举报
网络信息检索技术概述

网络信息检索技术概述 摘要:本文针对网络搜索引擎工作中的重点技术作出详尽的阐述,它包括Robot程序、索引数据库、检索程序三个方面。通过他们来概述WWW网络信息检索技术的发展状况。 关键词:Robot程序、数据索引、遍历算法、相关性 随着互联网的发展,网络信息不断爆炸式的扩张,网民怎么才能从这样海量的信息中找到他们所需要的信息呢?搜索引擎,这是目前为止,世界上最流行的一种准确获得信息的一种工具。象Google、Altavista、Infoseek 、Hotbot、Yahoo、网络指南针、北大天网和华好网景的ChinaOK等等。这些都是世界上非常著名的搜索引擎。他们都是通过网络机器人搜集网络信息,建立索引数据库,并且不但的更新,通过一定的相关性算法,对用户提供的请求作出响应,并按一定的次序输出高质量的信息。它的主要由下面三个部分组成:蜘蛛程序、索引数据库、检索程序。三个部分协调一致,其工作原理(图1)如下: 1 Robot技术程序 Robot是一种计算机的程序 ,可以自动地在网络中穿梭 ,该程序最重要的功能是使用索引策略 ,也就是查找网站和网页的次序。可以用题目、URL、关键词进行索引 ,也可以是以上几项的某种组合。由于Internet的数据量大 ,在现有的机器和网络条件下 ,搜索引擎只能对部分Internet上的资料进行采集 ;加上搜索的索引策略不同 ,所以对相同关键词的搜索在不同

文档评论(0)

1亿VIP精品文档

相关文档