- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
搜索引擎:原理、技术与系统
[General Information]
书名=搜索引擎:原理、技术与系统
作者=李晓明 闫宏飞 王继民著
页数=248
SS号
DX号=
出版日期=2005年04月第1版
出版社=科学出版社
书名
前言
目录
前言
第一章 引论
第一节 搜索引擎的概念
第二节 搜索引擎的发展历史
第三节 一些著名的搜索引擎
上篇 Web搜索引擎基本原理和技术
第二章 Web搜索引擎工作原理和体系结构
第一节 基本要求
第二节 网页搜集
第三节 预处理
第四节 查询服务
第五节 体系结构
第三章 Web信息的搜集
第一节 引言
一、超文本传输协议
二、一个小型搜索引擎系统
第二节 网页搜集
一、定义URL类和Page类
二、与服务器建立连接
三、发送请求和接收数据
四、网页信息存储的天网格式
第三节 多道搜集程序并行工作
一、多线程并发工作
二、控制对一个站点并发搜集线程的数目
第四节 如何避免网页的重复搜集
一、记录未访问、已访问URL和网页内容摘要信息
二、域名与IP的对应问题
第五节 如何首先搜集重要的网页
第六节 搜集信息的类型
第七节 本章小结
第四章 对搜集信息的预处理
第一节 信息预处理的系统结构
第二节 索引网页库
第三节 中文自动分词
第四节 分析网页和建立倒排文件
第五节 本章小结
第五章 信息查询服务
第一节 查询服务的系统结构
第二节 检索的定义
第三节 查询服务的实现
一、结果集合的形成
二、查询结果显示
第四节 本章小结
中篇 对质量和性能的追求
第六章 可扩展搜集子系统
第一节 天网系统概述和集中式搜集系统结构
一、天网系统结构
二、集中式搜集系统
第二节 利用并行处理技术高效搜集网页的一种方案
一、节点间URL的划分策略
二、关于性能的讨论
三、性能测试和评价
四、系统的动态可配置性设计
第三节 本章小结
第七章 网页净化与消重
第一节 网页净化与元数据提取
一、引言
二、DocView模型
三、网页的表示
四、提取DocView模型要素的方法
五、模型应用及实验研究
您可能关注的文档
- 手推割草机说明书.doc
- 技术服务合同No-国家中低压输配电设备质量监督检验中心.doc
- 扬州市数字化城管监督办公室DLP拼接大屏升级改造-扬州市政府采购网.doc
- 手机维修培训第一章手机维修培训基础-硬件和射频工程师.doc
- 技术要求-青岛港电子商务网.doc
- 技术组PMI检验完毕後-登入云端NDE管制全球资讯网.ppt
- 技术突破无线充电-快猴网.ppt
- 我的第①本c语言编程书:C语言从入门到精通 国家863中部软件孵化器.pdf
- 技能考核试题-咸阳职业技术学院.doc
- 投标人须知及采购需求-淄博市财政局.doc
- 招标项目及要求一、青川县社会福利中心配电房电气设备清单序号项目.doc
- 控制系统计算机辅助设计:MATLAB语言与应用 第二版-www.bzfxw.com .pdf
- 摘要本文主要介绍了一些在实习中减少数控车床碰撞损坏的方法,有.doc
- 摘要由于普通LED点阵显示屏动态显示通常采用硬件扫描驱动-Read.doc
- 放不下的小吃:50道经典易学易做的小吃.pdf
- 故必须有电源供应器(或整流器).ppt
- 放电球隙测压器是一对直径相同的球型电极,当其与高压试验变压器.doc
- 故障案例二疑因车轮轴承断裂集装箱卡车半路侧翻.doc
- 摩尔多瓦自由经济区-商务部欧洲司.doc
- 政府采购代理机构名称-扬州市邗江区政府采购网.doc
文档评论(0)