火车采集器教程-火车采集器快速入门++++.docVIP

  • 11
  • 0
  • 约小于1千字
  • 约 7页
  • 2018-04-04 发布于广东
  • 举报

火车采集器教程-火车采集器快速入门++++.doc

火车头采集器,教程,学习资料,技术资料,参考文件。

查看此教程建议视图: 因为包含很多图片,其他视图导致图片查看不全。 在使用火车采集器前 请务必知道一下几点。非常重要,具体怎么用会在后面教程一个一个说。 运行采集器 下载了火车头采集器解压后,运行(双击)文件夹下的主程序"LocoyPlatform.exe",如下图: 分组和采集规则 什么是分组什么是采集器规则如下图: 上图中图标是文件夹的我们在采集器里面称为“分组”,绿色铅笔图标的我们在采集器里面成为“采集规则”,上图看到规则是在分组下面的。 如果新建一个分组如下图: 如何新建规则如下图: 上图右击分组下面有个“导入任务至该分组”,我们可以把规则导入进来。 设置规则就是告诉采集器你要采集的数据。 页面源代码 再使用采集器的过程中我们经常会说到查看源代码,那么如何参看什么是页面源代码呢? 右击页面空白处: 我用的是ie有的浏览器叫做“源文件”都是一样的。 选择后我们打开了这样页面的源文件如下图: 上图看到我们在页面看到的内容是同样存在于页面源代码里面,而且采集器采集信息的时候也是通过页面源代码,换句话说你看信息是通过页面,采集器看信息是通过源代码。以后规则设置 都是通过页面源代码的。 标签名 什么是标签名呢? 在规则第二步:采集内容规则选项卡下面,那些“标题”“内容”就是我们建立的标签名,左侧还有添加修改等操作。 发布模块 点击发布按钮: 下图就是发布模块和发布配置: 采集规则是

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档