- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
JAVALucenienAction教程完整版
Lucene in Action(简体中文版)
共10部分
?第一部分 Lucene核心
1.????? 接触Lucene?
2.????? 索引?
3.????? 为程序添加搜索
4.????? 分析
5.????? 高极搜索技术
6.????? 扩展搜索
第二部分 Lucene应用
7.????? 分析常用文档格式
8.????? 工具和扩充
9.????? Lucene其它版本
10.?? 案例学习
?
[序章]
?
Lucene开始是做为私有项目。在1997年末,因为工作不稳定,我寻找自己的一些东西来卖。Java是比较热门的编程语言,我需要一个理由来学习它。我已经了解如何来编写搜索软件,所以我想我可以通过用Java写搜索软件来维持生计。所以我写了Lucene。
几年以后,在2000年,我意识到我没有销售天赋。我对谈判许可和合同没有任何兴趣,并且我也不想雇人开一家公司。我喜欢做软件,而不是出售它。所以我把Lucene放在SourceForge上,看看是不是开源能让我继续我想做的。
有些人马上开始使用Lucene。大约一年后,在2001年,Apache提出要采纳Lucene。Lucene邮件列表中的消息每天都稳定地增长。也有人开始贡献代码,大多是围绕Lucene的边缘补充:我依然是仅有的理解它的核心的开发者。尽管如些,Lucene开始成为真正的合作项目。
现在,2004年,Lucene有一群积极的深刻理解其核心的开发者。我早已不再每天作开发,这个强有力的工作组在进行实质性的增加与改进。
这些年来,Lucene已经翻译成很多其它的语言包括C++、C#、Perl和Python。在最开始的Java和其它这些语言中,Lucene的应用比我预想的要广泛地多。它为不同的应用(如财富100公司讨论组、商业Bug跟踪、Microsoft提供的邮件搜索和100页面范围的Web搜索引擎)提供搜索动力。在业内,我被介绍为“Lucene人”。很多人告诉我他们在项目中使用到Lucene。我依然认为我只听说了使用Lucene的程序的小部分。
如果我当初只是出售它,Lucene应用得不会这么广泛。程序开发人员看来更喜欢开源。他们在有问题时不用联系技术支持而只需查看一下源代码。如果这还不够,邮件列表中的免费支持比大多商业支持要好得多。类似Lucene的开源项目使得程序开发人员更加有效率。
Lucene通过开源已经变得比我想象的伟大的多。我见证了它的发展,是Lucene社区的努力才使得它如此兴旺。
Lucene的未来怎样?我无法回答。有了这本书,你现在也是Lucene社区的一员,现在由您将Lucene带往新的高地。旅途顺利!
?
DOUG CUTTING
Lucene和Nutch的作者
前言
来自Erik Hatcher
在Internet早期我就对搜索和索引感兴趣。我已经建立了用majordomo、MUSH(Mail User’s Shell)和少量Perl、awk及shell脚本来管理邮件列表的存储结构。我实现了一个CGI的web接口,允许用户搜索这个列表和其它用户的信息,其内部使用了grep。然后相继出现了Yahoo!、AltaVista和Excite,这些我都经常访问。
在我有了第一个儿子Jakob之后,我开始了数字照片档案的设计。我想开发一套管理图片的系统,可以给图片附加元数据,如关键字、拍摄日期。当然用我选择的尺寸定位图片是很容易的。在19世纪90年代末,我构建了基于文件系统的原型,使用了Microsoft的技术,包括Microsoft Index Server、Action Server Pages及处理图片的第三方COM组件。从那时起,我的职业生涯都消耗在这些类似的技术上了。I was able to cobble together a compelling application in a couple of days of spare-time hacking.
我的职业转向Java技术,并且我越来越少地利用Microsoft Windows。为了以系统无关的方式用Java技术重新实现我的个人照片档案系统及搜索引擎,我使用了Lucene。Lucene的简单易用远远超过了我的期望—我所期望的其它开源库或工具在概念上简单,但是却难以使用。
在2001年,Steve Loughran和我开始编写Java Development with Ant(Manning)。我们采用图片搜索引擎的思想,并把它推广为一个文档搜索引擎。这个程序示例在那本Ant书中使用,而且可被定制为图片搜索引擎。Ant的责任不仅来自于简单的编译打包的构建过程,也来自于定制的任务,,我们在构建过程中使用Lucene创建索引文件。Ant任务现在生存在Lucene的San
您可能关注的文档
- 2012年广东省中学生中初生物学联赛试卷及答案.doc
- 2012年广东省全国建工设程造价员资格考试.doc
- Elyreqs新东梅方晗版雅思阅读讲义.doc
- 2012年广东省公务员试考常见问题汇总.doc
- 2012年广东省初中毕生业学业考试数学试题及参考答案WORD版.docx
- EkingM5S155升级版评测.doc
- ELA认证标准(单简版本)翻译.doc
- 2012年广东省初中生联物赛试卷OCR版.doc
- emwomms漳州东市山县学前教育三年(2011-2013)发展规划.doc
- endnotex教5程自己终结版.docx
- 2025年河北邢台高新区(邢东新区)事业单位公开招聘工作人员7名考试备考题库及答案解析.docx
- 2025广西梧州市殡葬管理所招聘1人考试备考题库及答案解析.docx
- 2025年度乐山市公开选调公务员(参照管理工作人员)考试备考题库及答案解析.docx
- 2025年7月广东东莞凤岗镇招聘公办中小学临聘教师48人考试备考题库及答案解析.docx
- 2025呼伦贝尔海拉尔区事业单位人才引进71人考试备考题库及答案解析.docx
- 2025年芜湖市水务局所属事业单位招聘编外人员6人考试备考题库及答案解析.docx
- 2025年泸州叙永县考试转任公务员(参照管理工作人员)和公开考试选调事业单位工作人员75人考试备考题库及答案解析.docx
- 2025年度泸州市公开选调公务员考试备考题库及答案解析.docx
- 2025陕西咸阳市三原县招聘社区专职工作人员28人考试备考题库及答案解析.docx
- 2025年7月广东东莞市东坑镇中心小学招聘编外教师1人考试备考题库及答案解析.docx
最近下载
- 悦纳自己——爱自己的100种方式(课件)高一下学期心理健康课(通用版).pptx VIP
- 浙江省消防技术规范难点问题操作技术指南-2025修订稿(定稿).docx
- 再生医学技术:2025年关节软骨修复研究前沿报告.docx
- 《电梯监督检验和定期检验规则》(TSG T7001-2023).docx VIP
- T CNAS 32─2023 注射相关感染预防与控制.pdf VIP
- 罗宾斯组织行为学第18版中文ppt1.pptx VIP
- 浙商中拓(000906)公司2023年财务分析研究报告.pdf
- 食材食品质量问题退换货方案.docx VIP
- 智能找车系统(数字1对1)调试手册.doc VIP
- 工业智能控制.pdf VIP
文档评论(0)