火车采集器教程-论坛采集实例.docVIP

  • 17
  • 0
  • 约小于1千字
  • 约 4页
  • 2018-04-14 发布于广东
  • 举报
火车头采集器,教程,学习资料,技术资料,参考文件。

查看此教程建议视图: 因为包含很多图片,其他视图导致图片查看不全。 在你看这个教程的时候,保证你已经看过了“文章采集实例.doc”了,所以本教程就只是论坛采集和文章采集不同处,相同处就不再多说了。 我们依采集这个/spider-132850-1-1.html帖子里面主题还有回复,发帖人和回帖人。 同样打开帖子的页面源代码看下主题和回复的前后字符串在那里如下图: 查看页面源代码后我们发现主题和回复都在以字符“div class=t_fsz”开始以字符“/div”,我们写到采集器里面如下图: 别忘了勾选“该标签循环匹配”,如果帖子有分页要勾选“该标签在分页中匹配”,然后点击“确定”按钮。 同样的发现无论发布主题的用户名还是回帖的用户名开始结束字符也是一样如下图: 写到采集器里面如下图: 测试结果如下: 其实采集是一样的就是用到了循环, 循环的使用请参考教程:

文档评论(0)

1亿VIP精品文档

相关文档