- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一键批量下载网页图片
八爪鱼·云采集网络爬虫软件
八爪鱼·云采集网络爬虫软件
怎么一键批量下载网页图片
很多朋友有在网页上收集图片的需要,一个个下载整理费时费力,有没有一键批量下载网页图片的简便方法呢?下面本文介绍使用八爪鱼采集瀑布流网站图片(以百度图片采集为例)的方法,供大家学习使用。
采集网站:
/search/index?tn=baiduimageipn=rct=201326592cl=2lm=-1st=-1fm=resultfr=sf=1fmq=1511164186444_Rpv=ic=0nc=1z=se=1showtab=0fb=0width=height=face=0istype=2ie=utf-8hs=2word=%E5%A4%8F%E7%9B%AE%E5%8F%8B%E4%BA%BA%E5%B8%90
?
使用功能点:
??Ajax下拉滚动
/tutorialdetail-1/ajgd_7.html
??分页列表信息采集
/tutorialdetail-1/fylb-70.html
?
步骤1:创建采集任务
1)进入主界面,选择自定义模式
?
?
2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址”
?
?
3)系统自动打开网页。我们发现,百度图片网是瀑布流的网页,经过每一次下拉加载,都会出现新的数据。当图片足够多的时候,可无数次下拉加载。因而,此网页涉及AJAX技术,需要设置 AJAX 超时,以便确保数据采集的时候不会遗漏。
?
选中“打开网页”步骤,打开“高级选项”,勾选“页面加载完成向下滚动”,设置滚动次数为“5次”(根据自身需求进行设置),时间为“2秒”,滚动方式为“向下滚动一屏”;最后点击“确定”
?
注意:示例网站,没有翻页按钮,滚动次数、滚动方式会影响数据采集数量,可按需设置
?
步骤2:采集图片URL
1)选中页面内第一个图片,系统会自动识别同类图片。在操作提示框中,选择“选中全部”
?
?
2)选择“采集以下图片地址”
?
?
步骤3:修改Xpath
1)选中“循环”步骤,打开“高级选项”。可以看到八爪鱼系统自动采用的是“不固定元素列表”循环,Xpath为://DIV[@id=imgid]/DIV[1]/UL[1]/LI
?
?
2)将此条Xpath://DIV[@id=imgid]/DIV[1]/UL[1]/LI,复制到火狐浏览器中进行观察——仅可定位到网页中22张图片
?
?
3)我们需要一条能够定位到网页中全部所需图片的Xpath。观察网页源码并将Xpath修改为://DIV[@id=imgid]/DIV/UL[1]/LI,网页中全部所需的图片均被定位了
?
?
4)将修改后的Xpath://DIV[@id=imgid]/DIV/UL[1]/LI,复制粘贴到八爪鱼中相应位置,完成后点击“确定”
?
?
5)点击“保存”,再点击“开始采集”,这里选择“启动本地采集”
?
说明:本地采集占用当前电脑资源进行采集,如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,速度降低为原来的十分之一;采集到的数据可以在云上保存三个月,可以随时进行导出操作。
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择导出数据
?
?
2)选择合适的导出方式,将采集好的数据导出
?
?
步骤5:将图片URL批量转换为图片
经过如上操作,我们已经得到了要采集的图片的URL。接下来,再通过八爪鱼专用的图片批量下载工具,将采集到的图片URL中的图片,下载并保存到本地电脑中。
图片批量下载工具: HYPERLINK /s/1c2n60NI /s/1c2n60NI
1)下载八爪鱼图片批量下载工具,双击文件中的MyDownloader.app.exe文件,打开软件
?
?
2)打开File菜单,选择从EXCEL导入(目前只支持EXCEL格式文件)
?
?
3)进行相关设置,设置完成后,点击OK即可导入文件
选择EXCEL文件:导入你需要下载图片地址的EXCEL文件
EXCEL表名:对应数据表的名称
文件URL列名:表内对应URL的列名称
保存文件夹名:EXCEL中需要单独一个列,列出图片想要保存到文件夹的路径,可以设置不同图片存放至不同文件夹
如果要把文件保存到文件夹,则路径需要以“\”结尾,例如:“D:\同步\”,如果要下载后按照指定的文件名保存,则需要包含具体的文件名,例如“D:\同步\1.jpg”
如果下载的文件路径和文件名完全一样,则原先存在的文件会被删除
?
相关采集教程:
网站图片采集
HYPERLINK /tutorial/hottutorial/qita/
您可能关注的文档
最近下载
- 湖南省名校联考联合体2025-2026学年高一上学期10月联考语文试卷含答案.pdf VIP
- 部分常用岩土物理力学参数经验数值.doc
- 中南大学网校马克思主义基本原理考试.doc VIP
- 浙江省精诚联盟2025-2026学年高一上学期10月联考生物试卷含答案.docx VIP
- 2025-2026学年广东省广州市第一中学高一上学期10月月考数学试卷含详解.docx VIP
- 抖音爸爸博主“新父职”的数字实践研究_.pdf VIP
- 演示文稿青春期生长发育.ppt VIP
- 2023年中南财经政法大学公共课《马克思主义基本原理概论》期末试卷B(有答案).docx VIP
- 2024-2025学年广东省珠海市文园中学九年级(下)开学物理试卷.docx VIP
- 保健品营销策划.pdf VIP
文档评论(0)