小蜜蜂采集器文章采集器使用指南.docVIP

  • 15
  • 0
  • 约2.91千字
  • 约 8页
  • 2017-12-15 发布于天津
  • 举报
小蜜蜂采集器文章采集器使用指南.doc

小蜜蜂采集器文章采集器使用指南 一:建立站点和栏目 1:点击添加站点按钮出现如下页面 可以根据提示设立网站名称和网站归属栏目名称。 注:必须要先设置网站后才能设置栏目名称。并在设置栏目名称后选择网站,以便确立栏目的归属。 配置完成站点和栏目后出现如下页面 注:一个站点下可以有添加多个栏目 二:建立采集规则 1:为栏目添加规则 当你是第一次为新建立的站点添加规则时,请一定要点选站点列表栏目中的“添加规则”按钮。如下图: 点击后,我们可以选择为站点中的哪个栏目进行规则添加 2:规则编写 这里我们要着重说明,如何添加采集规则并详细说明如何编写规则。 以下的讲解将以一实际网站为例进行。 2.1 如何编写URL规则 我们以如下的链接地址为例:/tech/web/index.asp 出现如下页面 我们来分析这条URL的页面: 第一页的URL为 /tech/web/index.asp 第二页的URL 为 /tech/web/index_2.asp 第三页的URL 为 /tech/web/index_3.asp 这里我们可以看出除第1页外,起它页URL 都是有规律的在进行变化。因此我在URL链接区域填入下列内容 我们可以看见在“有规律的URL”里我们是采用了这样的的链接内容 /tech/web/index_[variable].asp 而实际的分页URL是这样的 /tech/web/in

文档评论(0)

1亿VIP精品文档

相关文档