网络矿工采集器V012SP1可视化配置图文教程.docVIP

  • 4
  • 0
  • 约1.24千字
  • 约 6页
  • 2016-11-23 发布于贵州
  • 举报

网络矿工采集器V012SP1可视化配置图文教程.doc

网络矿工采集器V012SP1可视化配置图文教程

网络矿工采集器V2012SP1可视化配置图文教程 网络矿工采集器从V2012Sp1版本开始,全面支持可视化配置,包括可通过可视化进行导航规则配置、翻页规则配置及采集数据规则配置。可视化配置是一种简单便捷的操作,用户无需掌握任何专业知识即可完成的采集任务的配置。 我们以一个采集导航的新闻信息为例,进行讲解。/gnxw/,这是一个列表页面,我们采集的数据就是通过这个列表页面将每篇文章的信息采集下来。我们以可视化的方式来进行配置。 启动网络矿工,新建一个采集任务,输入采集任务的名称:“大河网新闻采集”,点击“增加采集网址”输入采集的入口网址,就是我们上面的网址/gnxw/,如下: 选择“导航采集”,增加导航规则,增加导航规则就是可以通过这个列表页将文章逐一的打开并进行采集操作。 导航规则我们采用可视化配置的方法进行操作,点击“增加”按钮,在打开的窗口中点击“配置导航规则”,选择可视化配置,如下: 点击“可视化提取”打开可视化配置的页面,打开页面后,地址栏是我们输入的网址,点击“转到”即可打开此页面。 我们是需要通过可视化的方法获取一个列表,所以,我们在捕获前需要选择“多条记录 请通过鼠标捕获第一条和最后一条记录”,点击“开始捕获”,在页面中选择第一条记录后,滚动页面,再选中最后一条记录,系统即可完成可视化规则生成,如下: 我们可以看到xpath表达式中自动生成了一个数字参数,

文档评论(0)

1亿VIP精品文档

相关文档