- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
八爪鱼·云采集服务平台 八爪鱼·云采集服务平台【八爪鱼攻略】循环下翻下拉框的采集方法定位:循环点击下拉框,并选择下一个元素的步骤。适用情况:网页内存在可以下拉并选择对应元素的下拉框,采集的数据需要进行下拉框内元素的循环选择。示例网址: HYPERLINK / /步骤一:输入网址,保存网址,点击下拉框,选择循环切换下拉列表选项循环下翻下拉框-图1:点击下拉框,选择循环切换下拉列表选项步骤二:点击提取的元素,点击采集该元素的文本循环下翻下拉框-图2:采集元素文本步骤三:手动运行规则的每个步骤,检测是否正确。完成后,点击保存并启动循环下翻下拉框-图3:启动采集示例中,下拉框共有8个选项(图4),采集完成后可以看到共采集8条数据,证明循环下拉完成了所有循环下翻下拉操作。循环下翻下拉框-图4:8个选项假如,我们希望只循环下翻所有元素中的几条,那该如何操作呢?下面演示如何循环下翻所有元素的一部分。操作如下:步骤一:选中循环步骤,打开高级选项,我们看到,循环方式为“不固定元素列表”。将不固定元素列表中的这条Xpath,复制下来循环下翻下拉框-图5:查看循环方式步骤二:将循环方式更改为“固定元素列表”,将上个步骤中复制的Xpath,粘贴到下方内容框中,并为OPTION加上[2]/[3]/[4](指定循环第2、3、4个元素),然后点击确定循环下翻下拉框-图6:修改循环方式步骤三:我们可以看到,循环列表变为指定的三项(即第2到第4个元素)。启动采集后,采集到3条数据,证明完成了下翻所有元素的一部分循环下翻下拉框-图7:循环指定元素循环下翻下拉框-图8:采集指定项数据说明:以上示例中,循环下翻所有元素的一部分,基本步骤与循环所有元素步骤一致,区别在于高级选项的一些设置。如果希望只循环滚动下拉框中第2到第4个内容,对于还没有学会Xpath的同学,可以复制不固定元素列表中的完整XPath,点击固定元素列表,再点击下方内容框,粘贴之前复制的Xpath进去,然后在后面加上需要的内容顺序(第二条便填写[2])。这里需要注意,输入[2]的时候,输入法必须处于英文状态下,Xpath只支持英文标点符号的使用。这里再说明一次循环中高级设置中的各项内容:1)操作名:该循环的名字,可以对其进行修改以方便日后对规则的修正。2)执行前等待:进行该操作前等待的时间,如果设置执行前等待时间为5秒,则会在翻页完成后等待5秒再循环提取元素,如果希望采集每一个电影的信息前有个等待,则可以在提取步骤设置执行前等待。3)或者出现元素:配合执行前等待使用,在其中输入元素的XPath则可以在出现该元素的时候结束执行前的等待,例如我们设置循环文本步骤执行前等待10秒,或者出现元素设置为电影标题,则翻页操作后,假如第11秒标题加载出来,则八爪鱼会在第10秒尝试进行循环提取操作,而假如第8秒标题加载出来,则八爪鱼会在第8秒标题加载出来后结束循环的执行前等待来尝试进行循环提取操作。4)元素在Iframe选项:适用于该循环需要采集的内容在网页中是框架,在新手教程中暂不涉及5)循环方式:包括单个元素、固定元素列表、不固定元素列表、URL列表、文本列表。① 单个元素:表示只进行一个元素的循环操作,循环点击下一页便多是运用了此种操作;② 固定元素列表:表示循环一些固定的部分。在上述示例中,如果我们循环采集下拉框中固定位置元素,则是使用固定元素列表。③ 不固定元素列表:表示循环一些不固定的部分。在上述示例中,我们在示例中使用不固定元素列表,则是输入定位的Xpath。该Xpath定位到的所有元素都会出现在循环列表中。④ URL列表多用于打开多个网页采集内容的时候,可以放入多个网页链接进行循环打开操作。⑤ 文本列表:则多用于需要输入文字的网页,将列表中多个文本输入网页输入框进行查询。循环下翻下拉框-图9:列表中的多个文本循环下翻下拉框-图10:将列表中多个文本输入网页输入框进行查询6)满足以下条件时退出循环:可以设定循环次数,例如设定循环2次后退出,则循环提取步骤只会采集列表中前两条信息,如果循环翻页中设置循环2次后退出,则会循环采集前两页内容。相关采集教程:链家租房信息采集豆瓣电影短评采集1688热门商品采集八爪鱼——70万用户选择的网页数据采集器。1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置
您可能关注的文档
最近下载
- 日立牌SET-FREE AⅢ系列产品提案书20240628.docx VIP
- AquaECO特灵产品技术手册20231212.pdf VIP
- 中考语文成语易错48道选择题(有详细解析).pdf VIP
- 天津钢管集团股份有限公司.pdf VIP
- 海尔物联多联MAX样册2025-4-10.pdf VIP
- 2023年小升初语文专项练习《地名人名拼写规则》(含答案).docx VIP
- 辅警结构化面试题及答案(2025年.docx VIP
- SET-FREE AⅢ产品样册-日立.pdf VIP
- 105656-海尔智慧楼宇检测中心概况(实验室布局,测试能力范围,实验室介绍,数字化测试,实验室认证).docx VIP
- 井控考试试题库(DOC) .pdf VIP
文档评论(0)