- 5221
- 1
- 约1.97万字
- 约 19页
- 2019-04-20 发布于安徽
- 举报
北京林业大学本科毕业论文(设计)
PAGE \* MERGEFORMATI
基于Python的网络爬虫
摘要
随着计算机技术的不断发展,新的编程语言层出不穷,Python,Html正是其中的佼佼者。相比较早期普及的高级语言(Java,C语言)等,Python有着更加实用的模块和库,虽然牺牲了底层性,但却更加方便用于开发小型项目。此外,Html也已经被普遍用于网站前端,标记语言的特性结合CSS丰富了网页内容和形式,某种意义上也促进了更加人性化的电子商务系统的发展。本文的网络爬虫正式基于Python语言编写的,通过对Html抓取加工将数据可视化,以监测逐渐从线下转移到线上,并随着电子商务发展越发简单普遍难以追踪的非法野生动物贸易。
本文首先对计算器语言的发展,尤其是Python和Html的优势、基础概念以及性能进行介绍。最后着重介绍可以实现检测网络上非法野生动物贸易的爬虫的设计和实现。程序主要包括三个模块:URL解析,Html抓取,本地输出。Python的开发环境和工具分别是OS X和PyChram CE,主要调用了Python中的Urllib2,beautifulsoup模块。
最终的程序可以实现对指定网站,指定关键词抓取指定内容,保存内容到本地,以便于追踪和检测。
关键字:Python,HTML,爬虫,非法野生动物贸易
Python-Based Illegal wild
您可能关注的文档
- 毕业设计(论文)-MG400930交流电牵引采煤机牵引部设计.doc
- 毕业设计(论文)-SCARA型装配机器人系统设计.doc
- 毕业设计(论文)-YZ16全液振动压路机传动系统设计.doc
- 毕业设计(论文)-北京某卫星城污水处理厂工艺设计.doc
- 毕业设计(论文)-骨科三维有限元生物力学分析中网格生成的研究与实现.doc
- 毕业设计(论文)-四柱式压力机的设计.docx
- 毕业设计(论文)-太平66kV变电站电气部分设计.docx
- 毕业设计(论文)-微弱三维磁场测定的提高与改进.doc
- 毕业设计(论文)-微型全自主扫雪机器人机械结构设计.docx
- 毕业设计(论文)-无人智能车的车用轮边减速器设计与分析.docx
原创力文档

文档评论(0)