- 4
- 0
- 约 27页
- 2017-08-28 发布于安徽
- 举报
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
摘要
WWW 网络的迅猛增长使得搜索引擎面临了前所未有的挑战,搜索引擎如何
适应这种规模的急剧膨胀,成为一个备受关注的问题。面向主题搜索引擎可以有
选择性的抓取与主题相关的网页。选取的对象是一个或一组事先预定义的主题,
其特征由样本网页标志,而不是关键词。一般性的搜索引擎总是抓取尽量多的网
页以满足所有可能的查询请求;而主题搜索被设计为只抓取与选定主题相关的网
页。这不仅能够大大减少系统对硬件和网络资源的需求,而且还有助于提高抓取
的准确率和搜索结果的更新速度。
本文首先对比通用搜索引擎与主题搜索引擎的区别,总结主题搜索引擎的优
点;然后介绍目前世界上主题搜索引擎技术的发展状况。接着,综述了面向主题
中文搜索引擎的设计,详细介绍涉及该领域的三个核心技术:文档分类技术、中
文处理技术和网页搜集预测技术。对于以上三种技术,我们在简述已知算法的基
础上,都阐述了具体系统的实现方案。其中中文切词问题作为工作的重点,在文
章中有比较详尽的介绍,包括中文处理的背景知识,中文切词软件的基本原理和
中文切词词典的改进。
关键词:www 、通用搜索引擎、面向主题搜索引擎、文档分类算法、网页搜
集预测算法、中文切词
1
您可能关注的文档
最近下载
- 2025年高考新高考全国Ⅰ卷英语试题(含听力音频、听力原文和答案).pdf VIP
- 互联网金融概论(中央财经大学)中国大学MOOC慕课章节测验答案.pdf VIP
- 2026《高纯度苯乙烯生产反应工段和提纯工段计算设计》10000字.docx VIP
- 2025《S71200PLC编程及应用技术》试题试卷含答案.docx
- 幼儿园建构活动培训.pptx VIP
- 宝元528A应用手册(风铃素材).docx VIP
- 互联网金融概论(中央财经大学)中国大学MOOC 慕课章节测验答案.pdf VIP
- 《S71200PLC编程及应用技术》试题试卷含答案.docx VIP
- 第三方支付对商业银行盈利能力的影响——以中国工商银行为例.docx VIP
- 2025欧洲新生儿呼吸窘迫综合征管理共识指南解读.pptx VIP
原创力文档

文档评论(0)