ir讲义20131网页采集概论.pptVIP

  • 3
  • 0
  • 约小于1千字
  • 约 21页
  • 2016-07-22 发布于湖北
  • 举报
ir讲义20131网页采集概论

第一讲 网页采集;主要内容;为什么要进行网页采集;检索系统的基本模式;检索系统的基本模式;网页采集器的基本原理;什么样的采集器算好的采集器;遍历互联网;“遍”历行得通吗?;设置访问的层数;;更新周期;更新周期;网站运营者对采集器的态度;网站运营者对采集器的态度;每个网络蜘蛛都有自己的名字;网站和网络蜘蛛进行交流;Robots.txt;HTML中的标识;主要内容;软件实现1:网页采集器的设计与实现

文档评论(0)

1亿VIP精品文档

相关文档