- 11
- 0
- 约小于1千字
- 约 4页
- 2018-04-14 发布于广东
- 举报
火车头采集器,教程,学习资料,技术资料,参考文件。
查看此教程建议视图:
因为包含很多图片,其他视图导致图片查看不全。
在规则第三步:发布内容设置
启用方式二:保存为本地Word,Excel,Html,Txt等文件
保存文件格式 下拉框里面选择要保存文件
保存的位置 就是文件保存到那里
文件名格式 就是文件的命名方式 后面有个铅笔图标 那里可以直接选择 这里可以使用标签 也可以写固定的值
文件编码 是gbk2312 还是utf8 和文件模版一样的编码
这里重点说下文件模版,点击上图蓝色字体“查看默认模版”
模版就是要以那种方式保存采集到的文章,默认模版已经做了例子
根据自己的需要修改使用
模版里面的标签 一定要是规则里面的标签 不能写错名字 否则 标签采集到的值是不能保存的文件里面的
比如下图:
模版里面只写了标题内容 但是规则里面还有作者时间出处等标签 这样保存的文件是不包含作者 时间 出处等信息的
更多内容:/spider-77914-1-1.html
原创力文档

文档评论(0)