jsoup中文帮助文档.docVIP

  • 6
  • 0
  • 约1.2万字
  • 约 10页
  • 2017-02-27 发布于湖北
  • 举报
jsoup中文帮助文档Parsed HTML into a doc. ; Document doc = Jsoup.parse(html); (更详细内容可查看 解析一个HTML 字符串.) 其解析器能够尽最大可能从你提供的HTML 文档来创见一个干净的解析结果,无论HTML 的格 式是否完整。比如它可以处理:  没有关闭的标签 (比如: Lorem Ipsum parses to Lorem Ipsum )  隐式标签 (比如. 它可以自动将 Table data包装成 ?)  创建可靠的文档结构(html 标签包含head 和 body,在head 只出现恰当的元素) 一个文档的对象模型  文档由多个Elements 和TextNodes 组成 (以及其它辅助nodes:详细可查看:nodes package tree).  其继承结构如下:Document 继承Element 继承Node. TextNode 继承 Node.  一个Element 包含一个子节点集合,并拥有一个父Element。他们还提供了一个唯一的 子元素过滤列表。 参见  数据抽取:DOM遍历  数据抽取:Selector syntax 2.解析一个HTML 字符串 存在问题 来自用户输入,一个文件或一个网站的HTML 字符串,你可能需要对它进行解析并取其内容, 或校验其格式是否完整,或

文档评论(0)

1亿VIP精品文档

相关文档