《Python开发与实战》课件——C04-HTML内容解析.pptx

《Python开发与实战》课件——C04-HTML内容解析.pptx

HTML内容解析

XPath的介绍与使用lxml库的安装与使用Chrome浏览器分析网站BeautifulSoup的安装与使用

Xpath的介绍与使用Part01

XPath的介绍与使用XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath可用来在XML文档中对元素和属性进行遍历。XPath是W3CXSLT标准的主要元素。1、XPath简介图01-01

XPath的介绍与使用2、XPath路径表达式XPath使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。图01-02

XPath的介绍与使用3、XPath的节点在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。图01-07

XPath的介绍与使用4、节点关系父(Parent):每个元素以及属性都有一个父。book元素是title、author、year以及price元素的父。子(Children):元素节点可有零个、一个或多个子。title、author、year以及price元素都是book元素的子。如图01-08。图01-08

XPath的介绍与使用同胞(Sibling):拥有相同的父的节点。

文档评论(0)

1亿VIP精品文档

相关文档