资讯专栏INFORMATION COLUMN

XPath学习笔记

sherlock221 / 3048人阅读

摘要:如果参数匹配指定的模式,则返回,否则返回。其他关键信息其他关键信息支持的运算符支持的运算符轴轴轴可定义相对于当前节点的节点集语法轴节点选择器锚点描述节点选择器选取当前节点的所有先辈父祖父等。选取文档中当前节点的开始标签之前的所有节点。

背景

最近在做UI自动化, UI自动化的元素定位绕不开XPath, 抽空学习了XPath相关知识, 这里做下学习笔记.

XPath简介

XPath, 全称 XML Path Language, 即XML路径语言, 是一门在XML文档中查找信息的语言.

XPath是使用路径表达式来选去XML文档中的节点或者节点集. 节点是通过沿着路径(path)或者步(steps)来选取的.

XPath语法

路径表达式:

表达式 描述
nodename 选取此节点的所有子节点
/ 从当前节点选取直接子节点
// 从匹配选择的当前节点选择所有子孙节点
. 选取当前节点
.. 选取当前节点的父节点
@ 选取属性

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点.
谓语被嵌在方括号中

谓语 描述
n 第n个元素
last() 最后一个元素
last()-n 倒数第n+1个元素
position() 选取前n-1个元素
@XXX 可以嵌套表达式

选取未知节点

XPath通配符可以用于选取未知的XML元素.

通配符 描述
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型的节点

选取若干路径

通过在路径表达式中使用“|”, 可以选取若干个路径.

eg:

路径表达式 结果
//* 匹配文档中的所有元素
//title[@*] 匹配所有带有属性的title元素
//title //price
/bookstore/book[price>35.00] 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。

XPath标准函数

XPath包含有超过100个内建函数. 这些函数用于字符串值、数值、日期和时间比较、节点和QName处理、序列处理、逻辑值等.

函数 描述
contains(@AA, "XXX") 属性AA是否包含XXX的元素
starts-with(string1,string2) 如果 string1 以 string2 开始,则返回 true,否则返回 false。
ends-with(string1,string2) 如果 string1 以 string2 结尾,则返回 true,否则返回 false。
matches(string,pattern) 如果 string 参数匹配指定的模式,则返回 true,否则返回 false。

其他关键信息

1.支持的运算符

and、or、mod、+、-、*、div、=、!=、<、<=、>、>=

2.XPath Axes(轴)

  • 轴可定义相对于当前节点的节点集.
  • 语法: 轴::节点选择器
锚点 描述
ancestor::节点选择器 选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
attribute::节点选择器 选取当前节点的所有属性值
child 选取当前节点的所有直接子元素
descendant 获取当前节点的所有后代元素(子、孙等)
following 获取当前节点的结束标签之后的所有节点
following-sibling 可以获取当前节点之后的所有同级节点
namespace 选取当前节点的所有命名空间节点。
preceding 选取文档中当前节点的开始标签之前的所有节点。
self 选取当前节点

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/1367.html

相关文章

  • 学习笔记CB005:关键词、语料提取

    摘要:库实现关键词提取。做抓取器,创建文件。生成,正确抓取网页。分析抓取结果,链接嵌在标签属性。添加到抓取队列抓取。提取正文,去掉标签,保存摘要。提取时,提取标题和摘要,传递到处理函数,抓取完成后能接到这两个值,提取。 关键词提取。pynlpir库实现关键词提取。 # coding:utf-8 import sys import importlib importlib.reload(sys...

    SQC 评论0 收藏0
  • XML学习笔记--背诵版

    摘要:声明语句是可选部分如果存在需要放在文档的第一行所谓的文档声明就是告诉解析器当前文档格式版本号以及编码格式。所有的元素都必须是成对闭合标签非闭合标签是非法的,解析器将报错,不无正常解析标签对大小写敏感必须头尾标签一致。 前言 一直想系统性的学XML,就没时间学,今晚抽出几个小时时间学完了XML。过几天再过来看看,背一背应该就差不多,记得东西较多,没什么难理解的。 XML数据传输格式 第一...

    Ku_Andrew 评论0 收藏0
  • XML学习笔记--背诵版

    摘要:声明语句是可选部分如果存在需要放在文档的第一行所谓的文档声明就是告诉解析器当前文档格式版本号以及编码格式。所有的元素都必须是成对闭合标签非闭合标签是非法的,解析器将报错,不无正常解析标签对大小写敏感必须头尾标签一致。 前言 一直想系统性的学XML,就没时间学,今晚抽出几个小时时间学完了XML。过几天再过来看看,背一背应该就差不多,记得东西较多,没什么难理解的。 XML数据传输格式 第一...

    ssshooter 评论0 收藏0
  • Jmeter 使用笔记之 html 报告扩展(一)

    摘要:而在使用测试完后并不能直接生成的报告无论是用还是命令行启动。所以需要对这个报告进行扩展。在扩展的过程中进一步发现的聚合结果中最后的总体一行在某些情况下计算的数值是不准确的。 题记:在用 loadrunner 的时候可以生成一个 HTML 的报告,并且里面包含各种图表,各种详细的数据。而在使用 Jmeter 测试完后并不能直接生成 Html 的报告(无论是用 GUI 还是命令行启动)。 ...

    liujs 评论0 收藏0
  • JS学习笔记(第18章)(JavaScript与XML)

    摘要:函数接收三个参数上下文节点表达式和可选的命名空间对象。命名空间对象应该是下面这种字面量的形式。使用样式表转换文档跨浏览器使用这个函数接收两个参数要执行转换的上下文节点和文档对象。 showImg(https://segmentfault.com/img/bVbvHVd?w=962&h=496); 本章主要讲解了以下四个问题: 1、将XML解析为DOM文档 跨浏览器把XML解析为DOM文...

    GT 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<