《各平台数据采集及方法》课件——天眼查企业信息采集.pptxVIP

《各平台数据采集及方法》课件——天眼查企业信息采集.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

天眼查企业

信息采集

企业信息采集采集场景在天眼查搜索页面选择条件查询,得到条件查询后的结果列表页。实例网址,是选择了2个查询条件(省份地区:北京市;机构类型:企业)后得到的列表页。然后点击企业链接进入详情页,采集企业详情页的数据。采集字段公司名称、公司网址、公司简介、浏览量、更新时间、公司法人、公司注册资金、统一社会信用代码,纳税人识别号、公司类型等字段采集背景

企业信息采集在首页【输入框】中输入目标网址,点击【开始采集】,八爪鱼自动打开网页。步骤一打开网页

企业信息采集1、打开浏览器模式点击按钮,打开浏览器模式。在浏览器模式中,扫码登录。2、使用Cookie登录天眼查进入【打开网页1】设置界面,勾选【使用指定的Cookie】,点击【获取当前页面Cookie】并保存。这样就获取到了登录后的Cookie,启动时直接以登录状态打开网页。步骤二、天眼查登录

企业信息采集步骤三、建立【翻页循环】,以采集多页数据如果只是采集一页数据,可跳过此步骤。如果需要翻页以采集多页数据:关闭浏览器模式,选择页面中的【】按钮,在操作提示上单击【循环点击下一页】,创建【循环翻页】。

企业信息采集步骤四、建立【循环-点击元素】,进入每个企业详情页通过以下几步,实现循环点击每个企业链接,进入企业详情页①选中页面上第1个企业链接②在黄色操作提示框中,点击【选中全部】③点击【循环点击每个链接】,进入第1个企业的详情页

企业信息采集步骤五、提取目标字段并编辑字段。1、提取目标字段选中页面中的文本,然后在操作提示框中,点击【采集该元素文本】。文本类字段都可以按照这样的方式提取。示例中我们提取了公司名称、公司网址、公司简介、更新时间、公司法人、统一社会信用代码,纳税人识别号、等多个字段。

企业信息采集步骤五、提取目标字段并编辑字段。2、编辑字段进入【提取数据】设置界面,可删除多余字段,修改字段名,移动字段顺序、增加字段等。

企业信息采集1、单击【采集】并【启动本地采集】。启动后八爪鱼开始自动采集数据。步骤六、启动采集

企业信息采集2、采集完成后,选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。这里导出为Excel。数据示例步骤六、启动采集

谢谢观看Thanksforwatching

您可能关注的文档

文档评论(0)

青柠职教 + 关注
实名认证
服务提供商

从业10年,专注职业教育专业建设,实训室建设等。

1亿VIP精品文档

相关文档