大数据技术文档27.pdfVIP

  • 0
  • 0
  • 约3.19万字
  • 约 26页
  • 2026-05-21 发布于河北
  • 举报

第1章绪论

随着计算机技术、通信网、互联网的迅速发展和日益普及,Internet上的信息量快速长。从海

量的信息块中快速检索出用户真正需要的信息正变得很困难,信息搜索应向着具有分布式处理能

刀方向发展,本系统利用hadoop分布式开源框架良好的扩充能力、较低的运作成本、较高的效

率和稳定性来满足需求。

现状:

缺陷和不足:

(1)结果主题相关度不高。

(2)搜素速度慢。

引入hadoop+nutch+solr的优点:

(1

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档