火车采集器教程-HTTp接口查看运行情况.docVIP

  • 11
  • 0
  • 约小于1千字
  • 约 4页
  • 2018-04-14 发布于广东
  • 举报

火车采集器教程-HTTp接口查看运行情况.doc

火车头采集器,教程,学习资料,技术资料,参考文件。

查看此教程建议视图: 因为包含很多图片,其他视图导致图片查看不全。 在规则第三步:发布内容设置 启用方式二:保存为本地Word,Excel,Html,Txt等文件 保存文件格式 下拉框里面选择要保存文件 保存的位置 就是文件保存到那里 文件名格式 就是文件的命名方式 后面有个铅笔图标 那里可以直接选择 这里可以使用标签 也可以写固定的值 文件编码  是gbk2312 还是utf8 和文件模版一样的编码 这里重点说下文件模版,点击上图蓝色字体“查看默认模版” 模版就是要以那种方式保存采集到的文章,默认模版已经做了例子 根据自己的需要修改使用 模版里面的标签 一定要是规则里面的标签 不能写错名字 否则 标签采集到的值是不能保存的文件里面的 比如下图: 模版里面只写了标题内容 但是规则里面还有作者时间出处等标签 这样保存的文件是不包含作者 时间 出处等信息的 更多内容:/spider-77914-1-1.html

文档评论(0)

1亿VIP精品文档

相关文档