垂直搜索引擎若干问题研讨.pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
目录 目 录 目ji{:…………………………………………………………………………………………………………..i 中文摘要…………………………………………………………………………………………….v ABSTRACT………………………………………………………………………………………………….vii 图目录……………………………………………..…………………………………………………………….ix 表目录…………………………………………………….……………………………………………………..xi 第一章. 绪论…………………………………………………………………………………。1 1.1 本文研究背景……………………………………………………………………………l 1.2 垂直搜索引擎的研究现状………………………………………………………………2 1.2.1基于主题的定向搜索概述…………………………………………………………..3 1.2.2深度Web的领域数据集成………………………………………………………….4 1.2.3垂直搜索系统的性能指标…………………………………………………………一6 1.2.4面向领域的Web数据挖掘及可视化展示………………………………………….8 1.3 本文的研究目标和主要贡献………………………………………………………….12 1.4 本文结构………………………………………………………………………………~l3 第二章. Web信息采集与搜索引擎基础. 5 2.1基本概念…………………………………………………………………………………..1 2.1.1H丌P协议………………………………………………………………………………………………….15 2.1.2HTML语言…………………………………………………………………………………………………l8 2.1.4 www的体系结构和信息资源…………………………………………………….19 2.2W曲信息采集的基本原理………^………………………………………………………一20 2.3W曲信息采集系统的基本组成………………………………………………………….20 2.4搜索引擎与Web信息采集…………………………………………………………….22 2.4.1搜索引擎的分类……………………………………………………………………22 2.4.2搜索引擎的基本结构………………………………………………………………23 2.4-3搜索引擎信息采集面临的挑战……………………………………………………24 2.5本章小结………………………………………………………………………………….25 第三章. 基于主题的Web信息采集…… ……………………………….27 3.1 国内外相关研究进展………………………………………………………………….27 3.2 基于主题的W曲信息采集原理………………………………………………………30 目录 3.2.1采集策略…………………………………………………………………………….30 3.2.2基于主题的Web信息采集系统结构……………………………………………3l 3.3 采集的主题问题……………………………………………………………………….32 3.3.1W曲网页文本的特点……………………………………………………………….32 3.3.2Web信息的主题目录………………………………………………………………33 3-3.3主题词典和分词处理………………………………………………………………34 3.3.4网页文本主题的识别………………………………………………………………35 3.4 本章小结…………………………………………………………………………………39 第四章. 超链接主题预测算法UTP……………………………………………………。41 4.1URL主题相关度的决定因素……………………………………………………………4l

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档