- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
XPath解析库
Contents知识目标掌握XPath使用方法技能目标提高数据采集和处理能力素养目标培养良好的信息素养和道德意识
XPath简介XPath(XMLPath)是一种查询语言也称为XML路径语言,功能:XMLHTML树状结构中寻找结点确定XML文档中某部分位置。
XPath简介XPath使用路径表达式选取:XPath(XMLPath)是一种查询语言中的节点或者节点集XML文档这些路径表达式代表着从一个节点到另一个或者一组节点的顺序,并以“/”字符进行分隔。
XPath简介XML文档中的节点例子:示例1?xmlversion=1.0encoding=UTF-8?bookstorebooktitlelang=en毛泽东选集/titleprice29.99/price/bookbooktitlelang=enLearningXML/titleprice39.95/price/book/bookstoreXMLbookstore(文档节点)price29.99/price(元素节点)lang=en(属性节点)路径表达式:/bookstore/book/priceXML文档被作为节点树来对待。树的根被称为文档节点或者根节点。
XPath简介节点是通过沿着路径来选取的。下面列出了常用的路径表达式:XPath使用路径表达式在XML文档中选取节点表达式说明nodename选取nodename节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点..选取当前节点的父节点@选取属性父节点表示当前节点的上一层节点,子节点表示当前节点的下一层节点。子孙节点表示当前节点的所有下层节点。说明
XPath简介示例2?xmlversion=1.0encoding=UTF-8?bookstorebooktitlelang=enHarryPotter/titleprice29.99/price/bookbooktitlelang=enLearningXML/titleprice39.95/price/book/bookstoreXML路径表达式结果bookstore选取bookstore元素的所有子节点。/bookstore选取根元素bookstore。注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!bookstore/book选取属于bookstore的子元素的所有book元素。//book选取所有book子元素,而不管它们在文档中的位置。bookstore//book选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置。//@lang选取名为lang的所有属性。列出一些路径表达式以及表达式的结果:
谓语(Predicates)谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。
谓语(Predicates)路径表达式结果/bookstore/book[1]选取属于bookstore子元素的第一个book元素。/bookstore/book[last()]选取属于bookstore子元素的最后一个book元素。/bookstore/book[last()-1]选取属于bookstore子元素的倒数第二个book元素。/bookstore/book[position()3]选取最前面的两个属于bookstore元素的子元素的book元素。//title[@lang]选取所有拥有名为lang的属性的title元素。//title[@lang=eng]选取所有title元素,且这些元素拥有值为eng的lang属性。/bookstore/book[price35.00]选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00。/bookstore/book[price35.00]//title选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00。列出带有谓语的一些路径表达式,以及表达式的结果:
选取未知节点XPath通配符可用来选取未知的XML元素通配符描述*匹配任何元素节点@*匹配任何属性节点node()匹配任何类型的节点列出一些路径表达式,以及这些表达式的结果:路径表达式结果/bookstore/*选取bookstore元素的所有子元素//*选取文档中的所有元素//title[@*]选取所有带有属性的title元素
选取若干路径通过在路径表达式中使用|运算符,可以选取若干个路径。列出一些路径表达式,以及这些表达式的结果:路径表达式结果/
您可能关注的文档
- 《数据采集技术》课件——多线程爬虫.pptx
- 《机械制图》课件——3-4绘制正等轴测图.pptx
- 《生理学》课件——胰岛及胰岛素的生理作用.pptx
- 《Python程序设计》课件——项目一 搭建Python开发 安装Python解释器.pptx
- 《机械制图》课件——2-2认识点的投影.pptx
- 《针法灸法》课件——进针法.pptx
- 法院领导干部述学述职述廉述法报告.docx
- 某市审计局党组巡察整改专题民主生活会对照检查材料.docx
- 在全县教育系统警示教育大会上的讲话.docx
- 全市老干部工作会议上讲话稿.docx
- 某区纪委书记年度民主生活会“四个带头”个人对照检查材料.docx
- 某县纪委监委2024年工作总结及2025年工作计划.docx
- 某市场监督管理局2024年第四季度意识形态领域风险分析研判报告.docx
- 县委书记履行全面从严治党“第一责任人”职责情况汇报.docx
- 税务局党委书记2024年抓党建工作述职报告.docx
- 某市税务局副局长202X年第一季度“一岗双责”履行情况报告.docx
- 副县长在全县元旦春节前后安全生产和消防安全工作部署会议上的讲话.docx
- 某市委书记个人述职报告.docx
- 某县长在县委常委班子年度民主生活会个人对照检查材料1.docx
- 某县长在县委常委班子年度民主生活会个人对照检查材料.docx
文档评论(0)