火车采集器教程-列表页及标签Xpath可视化提取功能.docVIP

  • 257
  • 0
  • 约1千字
  • 约 10页
  • 2018-04-04 发布于广东
  • 举报

火车采集器教程-列表页及标签Xpath可视化提取功能.doc

火车头采集器,教程,学习资料,技术资料,参考文件。

查看此教程建议视图: 因为包含很多图片,其他视图导致图片查看不全。 Xpath可视化提取功能旨在做的用户所见即所得,仅仅通过鼠标点击了配置规则。但是次功能不适合大部分网站。 使用Xpath方式获取地址 在第一步,我们通过Xpath方式来获取内容页地址 如上图,选择“使用Xpath方式获取地址”,选中后右侧有个“使用Xpath浏览器”按钮,点击下。 在地址栏里面输入列表页地址,然后点击右侧绿色的按钮,使用这个浏览器来访问我们要采集的列表页地址。 点击上图的那个红色标志的箭头,然后鼠标放到浏览器内就有个淡蓝色的框,表示被选中的部分, 那么要选中那一部分才行呢?看下图 当淡蓝色框 选中的部分 在左下角,能显示出文章地址,就说明这个淡蓝色的框选择的就合适,然后鼠标在选中的框那里轻轻点击下,不需要点击访问内容页,只需要点击下就可以。 这里看到点击后,看下图有个变化: 和上图这个地方不一样,变成初始状态了,下面要再做一遍,也是首先点击这个,再选中标题。要注意。 然后我们再随便找个标题按照上面的步骤再做一遍,这一步非常的重要,必须要重复做2遍。 然后如上图点击测试,如果测试结果正确,就点击确定按钮 Xpath表达式就自动填写好了。                      如果测试提示结果如下图:            上面说了这个方式不适合所有的网

文档评论(0)

1亿VIP精品文档

相关文档