网络爬虫分析.docxVIP

  • 10
  • 0
  • 约1.58万字
  • 约 17页
  • 2017-06-01 发布于湖北
  • 举报
开始您的试用使用HttpClient和HtmlParser实现简易爬虫这篇文章介绍了HtmlParser开源包和HttpClient开源包的使用,在此基础上实现了一个简易的网络爬虫 (Crawler),来说明如何使用HtmlParser根据需要处理 Internet 上的网页,以及如何使用HttpClient来简化 Get 和 Post 请求操作,构建强大的网络应用程序。回页首HttpClient与HtmlParser简介本小结简单的介绍一下HttpClinet和HtmlParser两个开源的项目,以及他们的网站和提供下载的地址。HttpClient简介HTTP 协议是现在的因特网最重要的协议之一。除了 WEB 浏览器之外, WEB 服务,基于网络的应用程序以及日益增长的网络计算不断扩展着 HTTP 协议的角色,使得越来越多的应用程序需要 HTTP 协议的支持。虽然 JAVA 类库 .net 包提供了基本功能,来使用 HTTP 协议访问网络资源,但是其灵活性和功能远不能满足很多应用程序的需要。而 Jakarta Commons HttpClient组件寻求提供更为灵活,更加高效的 HTTP 协议支持,简化基于 HTTP 协议的应用程序的创建。HttpClient提供了很多的特性,支持最新的 HTTP 标准,可以访问这里了解更多关于HttpClinet的详细信息。目前有很多的开源项目

文档评论(0)

1亿VIP精品文档

相关文档