- 5
- 0
- 约3.78千字
- 约 6页
- 2018-06-16 发布于河北
- 举报
利用全文检索技术实现校园网的信息检索.doc
利用全文检索技术实现校园网的信息检索
摘要:本文利用全文检索算法构造了一个适用于校园网络的搜索引擎,该引擎的主要特点是:将搜索引擎主要分为前端和后端,后端获取Web文档,然后分词,建立和更新索引;前端提取索引库中的内容,向客户提供检索服务。
关键词:二叉树、搜索引擎、网络蜘蛛
随着Internet的飞速发展,各种网上应用不断发展。目前网上中文信息的数量增长迅猛,使得基于全文检索技术的中文搜索引擎越来越多。而针对校园网的检索系统却相对缺乏。校园网面对的是学校中的学生和老师用户,其主要作用是方便用户进行资料的查询,或是学术讨论,或是友谊联系等等。相对来说,在校园网中,数据量和数据的类型没有Internet上的丰富,对查准率的要求高于查全率,本文利用一种基于最大匹配法的全文检索技术,构造适用于局域网内信息检索的搜索引擎。
1校园网搜索引擎的产生环境
1.1将Internet网上的搜索引擎用于校园网的弊端
近十年来,中文信息在Internet网上的迅速发展,产生了大量的中文搜索引擎,比较著名的有:中文雅虎、搜狐、百度搜索、天网搜索、google搜索等。这些搜索引擎主要是针对Internet网上海量、无序的信息而设计的;对于校园内的局域网来说,信息量远不如Internet上丰富和复杂,如果将以上搜索引擎用于校园网内的信息检索,无疑是“杀鸡用牛刀”,而且会严重影响到检索质量。其原因如下:
1、
原创力文档

文档评论(0)