垂直搜索引擎在网络购物系统中研究与应用.pdf

垂直搜索引擎在网络购物系统中研究与应用.pdf

垂直搜索引擎在网络购物系统中的研究与应用 捅 矍 随着信息技术的迅速发展,互联网已经成为了当今世界上最大的信息存储 库,它为人们提供了良好的信息共享和资源共享的服务。但是互联网上信息量的 急剧增加也带了大量的重复信息和垃圾信息,用户很难在这种环境中找到自己需 求的信息及资源,那么如何高效地检索互联网信息就成为了必须解决的问题。在 这种情况下,针对特定的人群及特定的领域范围的垂直搜索引擎就应运而生,也 成为了搜索引擎的一个研究热点。本论文的研究就是围绕这一热点展开的。 本文研究了如何实现一个应用于购物系统的针对网络购物的购物垂直搜索 引擎。本文对通用搜索引擎的工作原理和主要组成部分作了介绍,进而讲述了垂 直搜索引擎的特点。为了实现该系统,本文引入了通用搜索引擎的架构模型,即 网络抓取、预处理和索引、检索器、用户接口四部分,重点讲述了这些组成部分 各自的工作原理和实现方式,阐述了专题网络蜘蛛的搜索策略及信息过滤方法, 如何对网页信息进行预处理以满足索引的建立需要,如何建立最终的数据索引, 以及对搜索结果的大量网页进行排序。其中还用到了开源的全文索引引擎 Lucene和网页抓取Heritrix,对它们也做了介绍。在设计开发的过程中, Apach

文档评论(0)

1亿VIP精品文档

相关文档