搜索引擎网络蜘蛛程序代码.docVIP

  • 1
  • 0
  • 约7.09千字
  • 约 12页
  • 2018-01-05 发布于河南
  • 举报
搜索引擎网络蜘蛛程序代码

搜索引擎/网络蜘蛛程序代码/wiki/topic/339167 国外开发的相关程序 1、Nutch 官方网站 / 中文站点 / 最新版本:Nutch 0.7.2 Released Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。 2、Lucene 官方网站? 中文站点? / Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包[用Java写的],即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 3、Larbin: /index-eng.html larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 国内开发的相关程序 1、SQLET - 开放源码的中文搜索引擎?? 官方网站 /

文档评论(0)

1亿VIP精品文档

相关文档