新浪微博用户爬虫方法.docxVIP

  • 15
  • 0
  • 约2.63千字
  • 约 31页
  • 2018-03-23 发布于江苏
  • 举报
新浪微博用户爬虫方法

新浪微博用户爬虫方法本文介绍使用八爪鱼爬虫软件采集微博用户信息的方法。作为一个活跃的社交网路平台,微博具有大量用户,每个用户信息都十分有价值。将需要的用户信息采集下来,对我们分析某项微博活动、某个微博事件极有助益。本文将以采集关注某个博主的用户群体为例。这些用户群体,我们一般称之为粉丝采集网站:/kaikai0818?topnav=1wvr=6topsug=1is_hot=1本文仅以采集关注某个博主的用户群体为例。微博上博主众多,大家可根据自身需要,更换不同博主的粉丝群体。也可以通过其他渠道或页面,采集微博用户信息。本文采集的粉丝群体字段为:粉丝ID、粉丝主页URL、关注人数、关注页URL、粉丝数、粉丝页URL、微博数、微博数URL、地址、简介、关注方式、光柱方式URL本文的采集分为两大部分:微博登录和粉丝信息采集微博登录某博主粉丝信息采集使用功能点:文本输入登录方法(7.0版本)/tutorialdetail-1/srdl_v70.htmlcookie登陆方法(7.0版本)/tutorialdetail-1/cookie70.htmlAJAX滚动教程/tutorialdetail-1/ajgd_7.html八爪鱼7.0教程——AJAX点击和翻页教程/tutorialdetail-1/ajaxdjfy_7.html微博登录步骤1:创建采集任务1)进入主界面,选择“自定义模式”,点击

文档评论(0)

1亿VIP精品文档

相关文档