- 2
- 0
- 约9.6万字
- 约 84页
- 2019-02-15 发布于上海
- 举报
目录
目录
目 录
第 一 章 绪 论 .”二”“.”.””.””””“.““…””“.”””二””“””“二”…“二“二“…”.…”.””.“二“”…. ”“”.1 1.1 搜 索 引擎简介 ·······················……1
1.1.1 什 么是搜 索 引擎 ··.·.·······························……1
1.1.2 搜 索 引擎 的发展 历史 ……1
1.1.3 搜 索 引擎 的分类 ····································……2
1.1.4 当前 主流搜 索 引擎 简介 ……,..…3
1.2 搜 索 引擎研 究现 状 ··································,·……4
1.3 搜 索 引擎 的发展趋势 ……5
1.4 本 文研 究 的主要 工作 ····································……7
1.5 论 文 的结构 ·.··……8
第 二章 搜 索 引擎 的综合研 究二““.”“二“二”:. ”二”·“·””二“·“二“·”“”·””二”二”·”·””二“··……9
2 .1 搜 索 引擎 与传 统信 息检 索 ……9
2 .2 搜 索 引擎 的体 系 结构 ……10
2.2 .1 网页采 集模 块 (搜 索器 C ~ ler) ……11
2.2 .2 索 引模块 (Indexer) ……14
2.2 .2.1 建 立 索 引 的过 程 ……14
2.2 .3 检 索模 块 (s earcher) ····················……16
2.3 实 际系统研 究 ·····················……16
2 .3 .1 G oo gle 的整 体 结 构 ……16
2 .3 .2 Go og le 的工 作 过 程 ·.·················,································……17
2 .3 .3 G oo gle 中 的主 要 数 据 结构 ……18
2 .3 .4 G oogle 主要 技 术 分 析 ……23
2 .4 本 章 小 结 ……26
第 三 章 中文 分 词 技 术 和 页面优 先度 算 法 “”””.“.”“.”…”…”.”.”””:. ”“”~.”………27
3,1 搜 索 引擎 的性 能 指 标 ……27
3.2 中文 分 词 技 术 ·····……27
3.2 .1 什 么 是 中文 分 词 技 术 ……,……27
3.2 .2 中文 分 词技 术 .,···.·.···············……28
乡
目录
目录
3.3 页面优 先度算法研究 ……36
3.3.1 页面优 先度 算 法基础 ……36
3.3.2 页面优 先度 算法 ……,……,.…,...……38
3.4 本章 小结 ……,……42 第 四章 N U T C H 搜索 引擎介绍 .”…“”””“.““““”“.”.“.”.”.“.”二”“.”“””“”.”.””…. ””.43
4 .IN u Tc H 搜 索 引擎 简介 ……43
4.2N U TcH 的基 本 结 构 ……43
4.3LU cEN E 索 引结构 ……,……46
4.3 .1 Lu cen e 索 引文件 逻 辑结构 ……,……46
4 .3.2Lu cen e 中的关键 索 引文件 ……46
4.4 本 章 小结 ……48
第 五章 中科 慧创有 限公 司补 丁 网站 的搜 索 系统““.”.”“…”.“.”.“””二””二”“.““…….49
5.1 开 发 平 台搭 建 ……49
5 .2 开发 软件 的安 装 和 配 置 ……,……49
5.3 在 N u Tc H 中增 加 中文 分 词模 块 ……54
5 .3 .1 N utch 原 有 的对 中文 的支 持 ……55
5 .3 .2N utch 的 An alysis 包 分 析 ……55
5.3 .3 在 N utch 中增加 中文分词模 块 ……59
5.4 改进 N U TCH 的页面优 先度 算法 ……,.……,……,.,……,……66
5.4 .1 N utch 原有 的叶面优 先度 算 法 ……,……“
5.4.2 改进 后 的页 面优 先 度 算 法 ……67
5.4.3 改进 页面优 先算法 的软件 实现 ……,……67
5.5 系 统 运 行 步骤 ……71
5.5.1 抓 取 页面 前 的准 备 工作 ……71
5.5.2 运 行 C raw l 命 令抓
您可能关注的文档
- 基于NUMECA的离心泵优化设计与性能研究-流体机械及工程专业论文.docx
- 基于NUM的无线传感器网络功率控制-信号与信息处理专业论文.docx
- 基于NURBS的三维人体建模技术及在跳板跳水仿真系统中的应用-应用数学专业论文.docx
- 基于NURBS的隧道与地层一体化三维建模-地图学与地理信息系统专业论文.docx
- 基于NURBS近似模型的全局优化方法研究-机械工程专业论文.docx
- 基于NURBS曲面的船舶破舱稳性计算方法研究-船舶与海洋结构物设计制造专业论文.docx
- 基于NURBS曲面的三维地质建模及可视化-计算机应用技术专业论文.docx
- 基于NURBS曲线的多轴运动控制插补算法的研究-机械工程专业论文.docx
- 基于NURBS曲线的前瞻自适应插补算法研究-机械工程专业论文.docx
- 基于NUSAP方法的区域降雨频率计算不确定性分析-水文学及水资源专业论文.docx
最近下载
- 2023年辽宁何氏医学院临床医学《药理学》科目期末试卷B(有答案).docx VIP
- 山西省阳泉市2025-2026学年第一学期期中检测八年级英语试卷含答案.pdf
- 【西门子】A02_828D铣削编程简明教程_07-铣削循环.pdf VIP
- 2023年辽宁何氏医学院中西医临床医学《药理学》科目期末试卷A(有答案).docx VIP
- 医务人员常见心理健康问题与自我调节专家讲座.pptx VIP
- 临时用地不可避让耕地和永久基本农田的论证报告.docx
- 2025年房地产经纪人交易文件云存储与管理工具专题试卷及解析.pdf VIP
- 《金融市场与金融机构基础课后答案》.pdf VIP
- 2026年江苏旅游职业学院单招职业适应性考试模拟测试卷最新.docx VIP
- 2025年互联网营销师CRM系统GDPR与国内法规适配专题试卷及解析.pdf VIP
原创力文档

文档评论(0)