- 45
- 0
- 约1.44千字
- 约 12页
- 2018-04-01 发布于湖北
- 举报
电影采集教程10.0汇总.doc
八爪鱼·云采集网络爬虫软件
电影采集教程
本文介绍使用八爪鱼采集百度糯米的方法,学会之后用户可以熟练使用我们的各种步骤来采集你所需要的各类网站数据,成为采集达人。
采集网站:
/movie/movielist
本文就以百度糯米主页下的某一个分类--电影影片,来具体说明怎么去采集类似的电影影片。
采集的内容包括:电影名称,电影效果,电影上映时间,电影别名,电影类型,电影时长,电影上映时间,电影剧情。
使用功能点:
列表循环
Ajax点击
步骤1:创建百度糯米电影影片采集任务
进入主界面,选择“自定义采集”
2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”
?
步骤2:创建循环下一页步骤
打开网页之后,进入百度糯米电影页面,打开右上角的流程按钮,可以显示你所创建好的步骤,我们往下拖动页面到列表的底部,可以看到下一页,点击下一页,选择“循环点击下一页”
在流程中选择“点击翻页”,在高级选项中设Ajax加载数据,时间为2~3秒
步骤3:创建循环列表
然后提取该页面所需的元素,点击包含第一条影片信息空白处,选择“选中子元素”
然后八爪鱼将会识别与第一条影片同样信息的其他影片,选择“选中全部”
采集数据
点击第一条影片,选择点击该元素
选择刚刚建立的“点击元素”,
原创力文档

文档评论(0)