Jsoup解析html.docVIP

  • 12
  • 0
  • 约11.68万字
  • 约 30页
  • 2016-11-06 发布于河南
  • 举报
Jsoup解析html

Jsoup解析html 今天做一个中间件服务区,需要对html进行解析,而我推举大家使用jsoup 1.解析和遍历一个HTML文档 如何解析一个HTML文档: String html = htmlheadtitleFirst parse/title/head + bodypParsed HTML into a doc./p/body/html; Document doc = Jsoup.parse(html); (更详细内容可查看 解析一个HTML字符串.) 其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果,无论HTML的格式是否完整。比如它可以处理: 没有关闭的标签 (比如: pLorem pIpsum parses to pLorem/p pIpsum/p) 隐式标签 (比如. 它可以自动将 tdTable data/td包装成tabletrtd?) 创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素) 一个文档的对象模型 文档由多个Elements和TextNodes组成 (以及其它辅助nodes:详细可查看:nodes package tree). 其继承结构如下:Document继承Element继承Node. TextNode继承 Node. 一个Element

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档