简单快速采集新浪新闻方式.docxVIP

  • 5
  • 0
  • 约1.69千字
  • 约 9页
  • 2017-05-27 发布于天津
  • 举报
简单快速采集新浪新闻方式.docx

常规新浪新闻采集 本教程是演示熊猫采集器如何快速且简单的采集到我们所需要的新闻。 个人感觉熊猫采集器不仅操作非常简单,而且还完全免费了,有兴趣的看官们可以搜索熊猫采集,去官网上面下载。 好了,废话不多说,进入到我们采集的过程上面来吧! 首先,我们打开我们这次采集需要的工具,也就是熊猫采集器,点击新建项目(标准) 随便输入一个项目名称,或者不输入也是可以的,系统默认会给你命名一个项目名,这里因为我是采集新浪新闻, 我就起了新浪新闻作为我需要的项目名 然后点击下一步 进入标题列表页及其翻页设置,列表页是包含我们要采集内容的链接网址的页面,比如百度搜索一个关键词,会列出来很多网页,这些网页我们就可以认为是标题列表页面。我们在采集新浪新闻的时候也要找这么一个标题列表页面,这里我们用新浪的军事新闻作为一个采集的示例,如下图: 我们将这个标题列表页的网址拷贝到我们的软件中来 点击我们的开始分析按钮 如果我们需要翻页采集,那么选择是即可,不要则选择否即可。我这里没有设置翻页采集,我选择的是否,当然这个根据实际情况来决定。(下面我会做一个针对如何手动设置翻页的补充) 点击下一步设置,进入选择内容页的设置,随便选择一个我们要采集的链接,会发现右边我们要采集的链接全部被红框框选起来了。那么这里我们就不要进行调整,直接再次下一步设置 来到内容页面模板管理,直接点击添加新模板,会把我们在上一步选中的链接作

文档评论(0)

1亿VIP精品文档

相关文档