- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Egothor
Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应
用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。
更多Egothor信息
Nutch
Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文
搜索和Web爬虫。
更多Nutch信息
Lucene
ApacheLucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。
Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen
提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的
是使使用者可以随时应自已需要自订其功能。
更多Lucene信息
Oxyus
是一个纯java写的web搜索引擎。
更多Oxyus信息
BDDBot
BDDBot是一个简单的易于理解和使用的搜索引擎。它目前在一个文本文件(urls.txt)列出的URL中爬行,
将结果保存在一个数据库中。它也支持一个简单的Web服务器,这个服务器接受来自浏览器的查询并返
回响应结果。它可以方便地集成到你的Web站点中。
更多BDDBot信息
Zilverline
Zilverline是一个搜索引擎,它通过web方式搜索本地硬盘或intranet上的内容。Zilverline可以从PDF,
Word,Excel,Powerpoint,RTF,txt,java,CHM,zip,rar等文档中抓取它们的内容来建立摘要和索引。
从本地硬盘或intranet中查找到的结果可重新再进行检索。Zilverline支持多种语言其中包括中文。
更多Zilverline信息
XQEngine
XQEngine用于XML文档的全文本搜索引擎.利用XQuery做为它的前端查询语言.它能够让你查询XML
文档集合通过使用关键字的逻辑组合.有点类似于Google与其它搜索引擎搜索HTML文档一
样.XQEngine只是一个用Java开发的很紧凑的可嵌入的组件.
更多XQEngine信息
MG4J
MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引,通过使内插编码(interpolativecoding)
技术.
更多MG4J信息
JXTASearch
JXTASearch是一个分布式的搜索系统.设计用在点对点的网络与网站上.
更多JXTASearch信息
YaCy
YaCy基于p2p的分布式Web搜索引擎.同时也是一个Http缓存代理服务器.这个项目是构建基于p2p
Web索引网络的一个新方法.它可以搜索你自己的或全局的索引,也可以Crawl自己的网页或启动分布式
Crawling等.
更多YaCy信息
Red-Piranha
Red-Piranha是一个开源搜索系统,它能够真正学习你所要查找的是什么.Red-Piranha可作为你桌面
系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作
为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜
索你公司的系统(包括SAP,Oracle或其它任何Database/Datasource),或用于管理PDF,Word和其它
文档,或作为一个提供搜索信息的WebService或为你的应用程序
(Web,Swing,SWT,Flash,Mozilla-XUL,PHP,Perl或c#/.Net)提供搜索后台等等.
更多Red-Piranha信息
LIUS
LIUS是一个基于JakartaLucene项目的索引框架。LIUS为Lucene添加了对许多文件格式的进行索引
功能如:
MsWord,MsExcel,MsPowerPoint,RTF,PDF,XML,HTML,TXT,OpenOffice序列和JavaBeans。针
对JavaBeans的索引特
文档评论(0)