- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
八爪鱼采集器如何使用?有na些优缺点?
八爪鱼采集器如何使用?有哪些优缺点?八爪鱼采集器,是一款通用的网页数据采集器,可应对各种复杂的网页结构,简单快速地将网页数据转化为结构化数据,以excel、数据库、api等形式导出。那么,八爪鱼采集器具有哪些优缺点,到底该如何使用呢?本文将具体讲述八爪鱼采集器的优缺点和使用方法。要了解的信息很多,请大家耐心阅读。一、八爪鱼采集器的优缺点优点:1、功能强大。八爪鱼采集器是一款通用爬虫,可应对各种网页的复杂结构(瀑布流等)和防采集措施(登录、验证码、封IP),实现百分之九十九的网页数据抓取。2、操作简单。模拟人浏览网页的操作,通过输入文字、点击元素、选择操作项等一些简单操作,即可完成规则配置,无需编写代码,对没有技术背景的用户极为友好。3、流程可视化。真正意义上实现了操作流程可视化,用户可打开“流程”按钮,直接可见操作流程,并对每一步骤,进行高级选项的设置(ajax/修改xpath等)。4、云采集。数量庞大的企业云,24x7不间断运行,可定时采集、关机也可采集,同时支持任务拆分,可提高数据采集速度。5、7.0版本推出的简易网页采集,内置主流网站大量数据源和已经写好的采集规则。用户只需输入关键词,即可采集到大量所需数据。缺点:自定义采集过程中,八爪鱼采集器系统自写的Xpath、自动生成的流程,可能无法满足数据采集需求。对数据质量要求高,则需自写Xpath,调成流程图等,以优化规则。使用自定义采集的同学,虽然八爪鱼操作简单,比较容易上手。但是,仍需对八爪鱼采集原理有所了解,看完相关教程,循序渐进,方能成为采集大神。成长周期较长。二、八爪鱼采集器如何使用以下是一个比较系统的八爪鱼使用手册,主要包括两大部分:八爪鱼入门词汇介绍;八爪鱼基本流程教程。大家可根据自身基础,选择不熟悉的部分,进行学习。在看完八爪鱼使用手册后,即可进入八爪鱼使用阶段。八爪鱼官网也有详细的操作教程可供参考。操作教程也分为两大部分:功能点讲解+实战教程(网站采集实例)。八爪鱼使用手册,访问此链接,了解详情:/doc-wf八爪鱼功能点+实战案例教程,访问此链接,了解详情:/tutorial?type=1version=v7.0以下为八爪鱼使用手册目录目录入门词汇介绍 ..................................................................................................................3 1.1.1 积分 ................................................................................................................ 3 1.1.2 规则 .................................................................................................................. 3 1.1.3 云加速 .............................................................................................................. 3 1.1.4 云优先 .............................................................................................................. 3 1.1.5 URL ................................................................................................................... 3 1.1.6 单机采集 .......................................................................................................... 3 1.1.7 云采集 .............................................................................................................. 3 1.1.8 定时采集 ...........................................................................
文档评论(0)