- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
八爪鱼·云采集服务平台
八爪鱼·云采集服务平台
网页信息采集软件如何使用
现在吃喝玩乐都很流行在网上团购,比如美团、大众点评、百度糯米等网上团购平台。这些平台上聚集了大量的商家,收集这些商家数据,可以方便商家自己与竞争者进行对比,分析消费者的喜好,从而改良自己的商品和服务。收集网页上的数据,就需要借助网页信息采集软件,这样可以大批量而又高效的收集。这里推荐一款免费好用的网页信息采集软件—八爪鱼采集器,下面就具体介绍一下这个软件的使用方法。
本文以采集大众点评商家信息为例子,介绍八爪鱼采集器的使用方法。
采集网站:
/search/category/7/0
使用功能点:
网页列表内容提取
相关采集教程:
美团商家信息采集
黄页88数据采集
赶集招聘信息采集
步骤1: 创建采集任务
1)进入主界面选择,选择自定义模式
使用八爪鱼采集器采集大众点评商家数据图1
2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址”
使用八爪鱼采集器采集大众点评商家数据图2
3)保存网址后,页面将在八爪鱼采集器中打开,红色方框中的列表就是
我们需要采集的信息
使用八爪鱼采集器采集大众点评商家数据图3
步骤2: 创建翻页循环
找到翻页按钮,设置翻页循环
1)将页面下拉到底部,找到下一页按钮,鼠标点击,在右侧操作提示框中,
选择“循环点击下一页”
使用八爪鱼采集器采集大众点评商家数据图4
步骤3: 商家信息采集
选中需要采集的字段信息,创建采集列表
编辑采集字段名称
1)如图,移动鼠标选中列表中商家的名称,右键点击,需采集的内容会变成绿色
使用八爪鱼采集器采集大众点评商家数据图5
注意:点击右上角的“流程”按钮,即可展现出可视化流程图。
2)移动鼠标选中红色方框里任意文本字段后,列表中所有适配内容会变成绿色,在右侧操作提示框中,查看提取的字段,可以将不需要的字段删除,然后点击“选中全部”
使用八爪鱼采集器采集大众点评商家数据图6
注意:?鼠标放在该字段上会出现一个删除标识,点击即可删除该字段。
使用八爪鱼采集器采集大众点评商家数据图7
3)点击“采集以下数据”
使用八爪鱼采集器采集大众点评商家数据图8
4)修改采集字段名称
使用八爪鱼采集器采集大众点评商家数据图9
5)点击下方红色方框中的“保存并开始采集”
使用八爪鱼采集器采集大众点评商家数据图10
6)根据采集的情况选择合适的采集方式,这里选择“启动本地采集”
使用八爪鱼采集器采集大众点评商家数据图11
说明:本地采集占用当前电脑资源进行采集,如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,速度降低为原来的十分之一;采集到的数据可以在云上保存三个月,可以随时进行导出操作。
步骤4: 数据采集及导出
1)采集完成后,会跳出提示,选择导出数据
使用八爪鱼采集器采集大众点评商家数据图12
2)选择合适的导出方式,将采集好的数据导出
使用八爪鱼采集器采集大众点评商家数据图13
相关采集教程:
淘宝数据采集:
/tutorial/hottutorial/dianshang/taobao
京东爬虫:
/tutorial/hottutorial/dianshang/jd
天猫爬虫:
/tutorial/hottutorial/dianshang/tmall
阿里巴巴数据采集:
/tutorial/hottutorial/dianshang/alibaba
美团商家数据采集:
/tutorial/meituansjpl
百度糯米电影采集:
/tutorial/bdnmdycj
今日头条采集:
/tutorial/hottutorial/xwmt/toutiao
腾讯新闻采集:
/tutorial/hottutorial/xwmt/tenxunnews
天眼查爬虫:
/tutorial/hottutorial/qyxx/tianyancha
企查查爬虫:
/tutorial/hottutorial/qyxx/qichacha
八爪鱼——100万用户选择的网页数据采集器
1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。
2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。
3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。
4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如
您可能关注的文档
- 素描速写中如何画眼睛、嘴巴、鼻子、耳朵.doc
- 素质教育成绩报告单评语(格式打印).doc
- 索绪尔的生命历程与思想脉络.pdf
- 紧急停车预案.ppt
- 素雅商务调研报告汇模板.ppt
- 紫甘薯色素的提取工艺研究.pdf
- 紫红薯色素的提取和精制.pdf
- 紫薯中提取色素的工艺研究朱珠.pdf
- 纠正、纠正措施、预防措施的联系与区别.pdf
- 红曲色素的提取及稳定性研究.pdf
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
文档评论(0)