(学士)学位论文基于lucene的桌面全文搜索引擎研究-.docVIP

(学士)学位论文基于lucene的桌面全文搜索引擎研究-.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(学士)学位论文基于lucene的桌面全文搜索引擎研究-

******学院 毕业设计(论文)开题报告 ****** 系 *********** 专业 200* 级 01班 课题名称: 基于Lucene的桌面全文搜索引擎研究 学生姓名: *** 学号:***** 指导教师: *** 报告日期: 200*年月 日 本课题所涉及的问题及应用现状综述 本课题来源于科研项目,主要是研究中文搜索中的关键算法和基于luence的搜索引擎,设计一个桌面搜索系统。本课题要求熟悉c/c++/java编程和人工智能。 Luence是一个用java写的全文搜索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎及部分文本分析引擎Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎. Lucene可以对任何的数据做索引和搜索.Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用.也就是说不管是Word,Html,PDF还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用,就可以用Lucene对它们进行索引以及搜索.Luence开发一个桌面搜索系统。 经过多年的发展,Lucene在全文检索领域已经有了很多的成功案例,并积累了良好的声誉.基于Lucene的全文检索产品和应用Lucene的项目在世界各地已经非常之多, 例如,众所周知的Apache软件基金会的网站使用了Lucene作为全文检索的引擎,IBM公司开源软件Eclipse的2.1版本中也采用了Lucene作为帮助子系统的全文索引引擎,相应的IBM公司的商业软件Web Sphere中也采用了Lucene.Lucene正以其开放源代码的特性,优异的索引结构,良好的系统架构获得了越来越多的应用. 2.本课题需要重点研究的关键问题、解决的思路及实现预期目标的可行性分析 本课题需要重点研究的关键问题:1.中文搜索引擎中的关键算法。2. 建立索引和搜索建立索引和搜索是搜索引擎最重要的也是最基本的两部分.Lucene来建立自己的桌面搜索引擎系统。 解决思路:在开始做本课题之前,先要学习中文搜索引擎的算法,学习如何建立索引和搜索,学习并了解Lucene以及如何应用Lucene。并认真学习c/c++/java和人工智能等方面的知识。这些都需要通过阅读和学习大量的书籍和资料来完成。虽然这些东西以前接触的比较少,对这方面知识了解还不是很多,但是我想通过一段时间的学习和老师的指导,这些问题都可以解决。先要对这方面的知识要有一个初步的了解。 可行性分析:要做好本课题,首先要了解算法方面的知识,其次要对c/c++/java和人工智能等方面的知识要有充分的掌握来作为基础。这些现在对我来说都有一定的困难,但是我可以通过不断的学习和老师的指导来逐渐的克服这些困难。 3.完成本课题的工作方案 要完成本课题首先要认真学习并掌握一定的算法方面的知识,认真学习c/c++/java和人工智能等方面的知识,提高自己的编程能力,还有就是要认真学习和了解Lucene,然后才能应用Lucene来建立搜索引擎,完成本课题。为此制定的具体的工作时间安排如下: 2007.3.20-2007.4.30 熟悉java语言,lucence库以及相关的搜索算法 2007.5.1-2007.5.31 软件的实现 2007.6.1-2007.6.25 论文撰写、准备答辩 4.指导教师审阅意见 指导教师(签字):    年 月 日 说明: 本报告必须由承担毕业论文(设计)课题任务的学生在毕业论文(设计) 正式开始的第1周周五之前独立撰写完成,并交指导教师审阅。 ******学院毕业设计 (论文)成绩评定表 学生姓名 性别 男 学号 专 业班 级 课题名称 课题 类型 难度 毕业设计(论文)时间 200 年3月日~200 年6月 日 指导教师 (职称:) 课题任务 完成情况 论 文 (千字); 设计、计算说 明书 (千字); 图纸 (张); 其它(含附 件): 指导教师意见 分项得分:开题调研论证分; 课题质量(论文内容) 分; 创新 分; 论文撰写(规范) 分; 学习态度 分; 外文翻译 分 指导教师审阅成绩: 指导教师(签字):     年月  日 评 阅 教 师 意见 分项得分:选题 分; 开题调研论证 分; 课题质量(论文内容 分;

您可能关注的文档

文档评论(0)

海纳百川 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档