新浪博客文章节采集器.docxVIP

  • 15
  • 0
  • 约1.96千字
  • 约 16页
  • 2018-05-28 发布于江苏
  • 举报
八爪鱼·云采集网络爬虫软件 新浪博客文章采集器 新浪博客拥有很多博主,会发布很多高质量的文章,有时候,有些朋友看到这些文章之后想采集下来,但是一篇一篇文章去复制效率太慢了,这个时候该怎么办呢?使用八爪鱼采集器,只需做好规则,即可全自动地将我们的想要的文章采集下来。 本文介绍使用八爪鱼采集新浪博客文章的方法。 采集网站: /s/articlelist_1406314195_0_1.html 采集的内容包括:博客文章正文,标题,标签,分类,日期。 步骤1:创建新浪博客文章采集任务 进入主界面,选择“自定义采集” 2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址” 步骤2:创建翻页循环 1)打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。点击页面下方的“下一页”,如图,选择“循环点击???个链接”,翻页循环创建完成。(可在左上角流程中手动点击“循环翻页”和“点击翻页”几次,测试是否正常翻页。) 2)由于进入详情页时网页加载很慢,网址一直在转圈状态,无法立即执行下一个步骤,因此在“循环翻页”的高级选项里设置“ajax加载数据”,超时时间设置为5秒,点击“确定”。 步骤3:创建列表循环 鼠标点击列表目录中第一个博文,选择操作提示框中的“选中全部”。 鼠标

文档评论(0)

1亿VIP精品文档

相关文档