- 15
- 0
- 约1.96千字
- 约 16页
- 2018-05-28 发布于江苏
- 举报
八爪鱼·云采集网络爬虫软件
新浪博客文章采集器
新浪博客拥有很多博主,会发布很多高质量的文章,有时候,有些朋友看到这些文章之后想采集下来,但是一篇一篇文章去复制效率太慢了,这个时候该怎么办呢?使用八爪鱼采集器,只需做好规则,即可全自动地将我们的想要的文章采集下来。
本文介绍使用八爪鱼采集新浪博客文章的方法。
采集网站:
/s/articlelist_1406314195_0_1.html
采集的内容包括:博客文章正文,标题,标签,分类,日期。
步骤1:创建新浪博客文章采集任务
进入主界面,选择“自定义采集”
2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”
步骤2:创建翻页循环
1)打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。点击页面下方的“下一页”,如图,选择“循环点击???个链接”,翻页循环创建完成。(可在左上角流程中手动点击“循环翻页”和“点击翻页”几次,测试是否正常翻页。)
2)由于进入详情页时网页加载很慢,网址一直在转圈状态,无法立即执行下一个步骤,因此在“循环翻页”的高级选项里设置“ajax加载数据”,超时时间设置为5秒,点击“确定”。
步骤3:创建列表循环
鼠标点击列表目录中第一个博文,选择操作提示框中的“选中全部”。
鼠标
您可能关注的文档
最近下载
- (正式版)DB15∕T 940-2015 《内蒙古地区沙漠公路勘测设计外业验收标准》.pdf VIP
- 2024版人教版英语四年级下册Unit5 Farms and us单元小练含答案.pdf VIP
- 第2讲 静电场中的能量.docx VIP
- 2013款一汽丰田普拉多_汽车使用手册用户操作图解驾驶车主车辆说明书电子版.pdf
- 平南县丹竹镇峰强石灰厂绿色化技改项目环境影响报告表.docx VIP
- 外研版(2019)高一英语必修第一册 Unit 1单元测试卷(含答案解析).docx VIP
- 五年级下册语文1-8单元作文范文(实用完整版).docx VIP
- XXX片区旧城改建项目监理旁站计划.doc VIP
- (2026)事业单位-时事政治热点题库及完整答案2026年.docx VIP
- 安徽省2024-2025学年八年级下学期期末数学试卷【含答案】.pdf VIP
原创力文档

文档评论(0)