基于的网络爬虫设计.pdf

下载文档

9
0
约9.09千字
约 9页
2020-03-04 发布于四川
举报
保障服务

基于的网络爬虫设计.pdf

基于 python 的网络爬虫设计【摘要】近年来，随着网络应用的逐渐扩展和深入，如何高效的获取网上数据成为了无数公司和个人的追求，在大数据时代，谁掌握了更多的数据，谁就可以获得更高的利益，而网络爬虫是其中最为常用的一种从网上爬取数据的手段。网络爬虫，即 Web Spider，是一个很形象的名字。如果把互联网比喻成一个蜘蛛网，那么 Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面（通常是首页）开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站，那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。那么，既然网络爬虫有着如此先进快捷的特点，我们该如何实现它呢？在众多面向对象的语言中，首选python ，因为 python 是一种“解释型的、面向对象的、带有动态语义的”高级程序，可以使人在编程时保持自己的风格，并且编写的程序清晰易懂，有着很广阔的应用前景。关

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于的网络爬虫设计.pdf

基于的网络爬虫设计.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档