吉林大学远程教育.doc

吉林大学远程教育.doc

吉林大学毕业论文(设计) 摘 要 本文首先对社交网络的现状进行了简要介绍,详细说明了社交网络中信息的特点及其价值,并分析了搜索引擎在社交网络领域应用时面临的困境。重点阐述了设计实现面向融合社交网络应用的搜索引擎所需要考虑的问题。 然后,介绍了搜索引擎的相关知识,深入研究了开源网络爬虫框架Heritrix和全文检索工具包Lucene;同时,根据设计目标和原则,设计出系统总体框架结构。接着,对系统进行实现,通过对Heritrix开源框架的定制和扩展,实现在社交网络内信息资源的爬取;对Lucene架构进行分析论述,在理解其设计思想的基础上进行扩展,并应用到系统中,实现面向社交网络的索引和检索服务;设计用户交互界面,对系统关键功能模块进行测试。 关键词 搜索引擎 社交网络 Lucene Heritri 目 录 一、绪论 1 (一)论文背景 1 (二)研究意义 3 (三)主要工作 4 (四)论文结构 4 二、搜索引擎技术研究 6 (一)搜索引擎概述 6 (二)搜索引擎工作原理 8 (三)搜索引擎的关键技术 10 三、面向融合社交网络应用的智能搜索引擎的设计 16 (一)系统需求分析 16 (二)系统总体结构设计 18 (三)关键功能模块设计 20 四、面向融合社交网络应用的智能搜索引擎的实现 24 (一)系统关键模块实现 24 (二)功能测试 30 结论 33 致谢 34 参

文档评论(0)

1亿VIP精品文档

相关文档