毕业论文 基于Lucene的桌面搜索引擎汇.docVIP

毕业论文 基于Lucene的桌面搜索引擎汇.doc

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业论文 基于Lucene的桌面搜索引擎汇

毕业论文 题目: 基于Lucene的桌面搜索引擎 学院: 管理科学与工程学院 专业: 信息管理与信息系统 摘 要 随着信息资源的高速膨胀在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档一个轻量级的全文检索软件,能够帮助用户方便地在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档关键词:、B/S、文本文件 Abstract This article fist introduces the system structure and principle of search engine based on the internet in detail, then gives a minute explanation form Based on the full-text search engine Lucene framework and principle. In order to understand the technology more deeply, I have programmed a news search engine by myself. The news search engine is explained and searched according to document-level directory, then indexs every searched information and adds it to the index file. Then after receiving the customers requests from the web server, it soon searchs the right information form the index engine. In the chapter of introducing search engine, it is not only elaborate the core technology, but also combine with the modern code,pictures included, easy to understand. Key Words:B/S、file 目录 绪论 3 1. 桌面搜索引擎与全文检索 5 1.1 搜索引擎的概念及发展 5 1.2 桌面搜索引擎简介 6 1.2.1 Windows自带搜索功能的不足 6 1.2.2 我们需要一款桌面搜索引擎 7 1.2.3 桌面搜索引擎现状 7 1.3 全文检索 8 1.3.1 什么是全文检索与全文检索系统 8 1.3.2 全文检索原理 9 1.3.3 全文检索的倒排索引原理 12 2. 开放源代码的全文检索引擎架构Lucene 13 2.1 Lucene简介 13 2.1.1 什么是Lucene 13 2.1.2 Lucene的应用、特点及优势 14 2.2 Lucene系统结构分析 15 2.3 深入Lucene 索引机制 17 2.4 Lucene文档分析与中文分词 19 2.4.1 Lucene分析器原理 19 2.4.2 中文分词 21 2.5 Lucene的索引效率 25 2.6 从Lucene学到更多 26 3. 基于Lucene的桌面搜索引擎 27 3.1 功能简介 27 3.2 桌面搜索引擎—索引器设计 28 3.2.1 索引器简介 28 3.2.2 界面设计 29 3.2.2 功能设计 30 3.3 桌面搜索引擎—索引器实现 31 3.3.1 解析器实现 31 3.3.2 中文分词考虑 34 3.3.3 索引器实现 35 3.4 搜索器实现 38 3.4.1 搜索器简介 38 3.4.2 搜索器界面 38 3.4.3 搜索器实现 38 3.4.4 实例演示 39 3.5 数据持久化 40 3.5.1 持久化简介 40 3.5.2 具体实现 40 6. 参考资料 41 绪 论 我们处在一个信息资源高速膨胀信息爆炸一个全球性的现象如果能够对这些信息做出一些筛选,既可以为我们的广大提供一些好的知识与信息,也为他们为了寻找这些知识与信息节省时间与成本.新产生的信息中有92%记录在硬盘等磁存储介质上,其次分别是胶片、纸张和光存储介质。人们可以利用搜索引擎,获得更加全面、详尽的信息,参考性和点拨性都很强。因此,相当一部分职场人士表示,搜索引擎当之无愧是他们工作中非常完美的助手。如今,越来越多的白领已把获取信息的途径,从直接上门户网站、社区转向了搜索引擎工具。使用字典等工具书,上图书馆查阅资料的历史,逐渐从白

文档评论(0)

liwenhua00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档