Playwright中locator() 方法快速定位网页元素[全面总结]

2024-03-18 08:12

本文主要是介绍Playwright中locator() 方法快速定位网页元素[全面总结],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Playwright 是一个用于浏览器自动化的库,它支持多种浏览器和多种语言。在 Playwright 中,`page.locator()` 方法用于创建一个元素定位器(Element Locator)。元素定位器是一个强大的工具,可以帮助你在页面上找到并操作元素。
------------
page.locator(selector)
page.locator(selector, **kwargs)


Playwright 的 `page.locator()` 方法的详细解释:

1. **基本用法**:`page.locator(selector)` 方法返回一个元素定位器(Element Locator),这个定位器可以用于执行在页面或框架上的操作。定位器会在执行操作之前立即解析到元素,因此,对同一个定位器的一系列操作实际上可能在不同的 DOM 元素上执行。如果这些操作之间的 DOM 结构发生了变化,就会出现这种情况。

2. **参数**:
   - `selector`:用于解析 DOM 元素的选择器。
   - `has`(可选):缩小方法的结果范围,只包含匹配此相对定位器的元素。例如,具有 text=Playwright 的文章匹配 `<article><div>Playwright</div></article>`。内部定位器必须相对于外部定位器,并从外部定位器匹配开始查询,而不是从文档根开始。注意,外部和内部定位器必须属于同一框架。内部定位器不能包含 FrameLocators。
   - `has_not`(可选,v1.33 新增):匹配不包含匹配内部定位器的元素的元素。内部定位器针对外部定位器进行查询。例如,没有 div 的文章匹配 `<article><span>Playwright</span></article>`。注意,外部和内部定位器必须属于同一框架。内部定位器不能包含 FrameLocators。
   - `has_not_text`(可选,v1.33 新增):匹配不包含指定文本的元素,可能在子元素或后代元素中。当传递一个字符串时,匹配是大小写不敏感的,并搜索子字符串。
   - `has_text`(可选):匹配包含指定文本的元素,可能在子元素或后代元素中。当传递一个字符串时,匹配是大小写不敏感的,并搜索子字符串。例如,"Playwright" 匹配 `<article><div>Playwright</div></article>`。

3. **返回值**:`page.locator()` 方法返回一个 Locator 对象可以用于执行各种操作,如点击、填充、检查、选择选项等。

详细解释疑问,这两个参数 `has` 和 `has_text` 的区别可能有些微妙。:
- `has`:这个参数接受一个定位器作为值,这个定位器用于在找到的元素内部进行查找。例如,`has='text=Playwright'` 表示找到的元素
必须包含一个文本为 "Playwright" 的子元素。这个子元素可以是任何类型的元素,只要它的文本是 "Playwright" 就可以。例如,下面的 HTML 代码段就符合这个条件:
```html
  <div class="my-class">
    <span>Playwright</span>
  </div>
  ```
- `has_text`:这个参数接受一个字符串或正则表达式作为值,这个值用于匹配找到的元素的文本或其子元素的文本。例如,
`has_text='Playwright'` 表示找到的元素或其子元素的文本中必须包含 "Playwright"。这个文本可以在任何地方,只要在找到的元素或其子元素的文本中就可以。例如,下面的 HTML 代码段就符合这个条件:
 ```html
  <div class="my-class">
    This is a test of Playwright.
    <span>More text here.</span>
  </div>
  ```
在这个例子中,"Playwright" 是在 `div` 元素的文本中,而不是在一个特定的子元素的文本中。
总的来说,
`has` 参数更关注于结构,它要求存在一个特定的子元素,而 `has_text` 参数更关注于文本,它要求找到的元素或其子元素的文本中包含特定的字符串或匹配特定的正则表达式。

-------------

以下是一些常用的page.locator()元素定位方法:

1. **CSS 选择器**: 你可以使用 CSS 选择器定位元素。例如,`page.locator('.my-class')` 会定位到页面上所有具有 "my-class" 类的元素。

2. **XPath**: 你也可以使用 XPath 表达式来定位元素。例如,`page.locator('//div[@id="my-id"]')` 会定位到页面上所有 id 为 "my-id" 的 div 元素。

3. **文本内容**: 你可以使用 `:text("my text")` 来定位包含特定文本的元素。例如,`page.locator(':text("Hello, World!")')` 会定位到页面上所有包含 "Hello, World!" 文本的元素。

4. **特性选择器**: 你可以使用 `[attr=value]` 来定位具有特定属性值的元素。例如,`page.locator('input[name="username"]')` 会定位到页面上所有 name 属性为 "username" 的 input 元素。

5. **ID 选择器**: 你可以使用 `#id` 来定位具有特定 id 的元素。例如,`page.locator('#my-id')` 会定位到页面上 id 为 "my-id" 的元素。

6. **类选择器**: 你可以使用 `.class` 来定位具有特定类的元素。例如,`page.locator('.my-class')` 会定位到页面上所有具有 "my-class" 类的元素。

7. **标签名选择器**: 你可以使用 `tagname` 来定位特定类型的元素。例如,`page.locator('div')` 会定位到页面上所有的 div 元素。

这些都是 Playwright 中 `page.locator()` 方法的常用定位方式。你可以根据你的需要选择合适的方法来定位元素。
----------

在 Playwright 中,`page.locator()` 方法返回一个元素定位器(Element Locator),这个定位器可以用于定位和操作页面上的元素。以下是一些更深入的介绍:

1. **链式定位**:`page.locator()` 的返回值本身也有 `locator()` 方法这意味着你可以链式地定位元素。例如,`page.locator('.my-class').locator('.my-subclass')` 会定位到所有具有 "my-class" 类的元素中,再次具有 "my-subclass" 类的元素。

2. **操作元素**:定位器提供了一系列方法用于操作元素,例如 `click()`、`fill()`、`check()`、`uncheck()`、`selectOption()` 等。这些方法可以直接在定位器上调用,例如 `page.locator('#my-id').click()` 会点击 id 为 "my-id" 的元素。

3. **获取元素属性和状态**:定位器还提供了一些方法用于获取元素的属性和状态,例如 `getAttribute()`、`innerText()`、`isVisible()`、`isChecked()` 等。例如,`page.locator('#my-id').getAttribute('value')` 会返回 id 为 "my-id" 的元素的 value 属性值。

4. **等待元素**:定位器提供了 `waitFor()` 方法用于等待元素出现。例如,`page.locator('#my-id').waitFor()` 会等待直到 id 为 "my-id" 的元素出现。

5. **处理多个元素**:如果定位器定位到多个元素,你可以使用 `nth()` 方法来选择其中的一个。例如,`page.locator('.my-class').nth(1)` 会选择第二个具有 "my-class" 类的元素(索引从 0 开始)。

6. **元素计数**:你可以使用 `count()` 方法来获取定位器定位到的元素数量。例如,`page.locator('.my-class').count()` 会返回页面上具有 "my-class" 类的元素的数量。

这些都是 Playwright 中 `page.locator()` 方法的高级用法。你可以根据你的需要使用这些方法来定位和操作元素。
--------

更多高级用法和技巧:

1. **元素的文本内容**:`textContent()` 方法可以用于获取元素的文本内容。例如,`page.locator('#my-id').textContent()` 会返回 id 为 "my-id" 的元素的文本内容。

2. **元素的 HTML**:`innerHTML()` 方法可以用于获取元素的内部 HTML。例如,`page.locator('#my-id').innerHTML()` 会返回 id 为 "my-id" 的元素的内部 HTML。

3. **元素的外部 HTML**:`outerHTML()` 方法可以用于获取元素的外部 HTML。例如,`page.locator('#my-id').outerHTML()` 会返回 id 为 "my-id" 的元素的外部 HTML。

4. **等待元素消失**:`waitFor({ state: 'detached' })` 方法可以用于等待元素消失。例如,`page.locator('#my-id').waitFor({ state: 'detached' })` 会等待直到 id 为 "my-id" 的元素消失。

5. **等待元素隐藏**:`waitFor({ state: 'hidden' })` 方法可以用于等待元素隐藏。例如,`page.locator('#my-id').waitFor({ state: 'hidden' })` 会等待直到 id 为 "my-id" 的元素隐藏。

6. **等待元素显示**:`waitFor({ state: 'visible' })` 方法可以用于等待元素显示。例如,`page.locator('#my-id').waitFor({ state: 'visible' })` 会等待直到 id 为 "my-id" 的元素显示。

7. **等待元素可编辑**:`waitFor({ state: 'editable' })` 方法可以用于等待元素可编辑。例如,`page.locator('#my-id').waitFor({ state: 'editable' })` 会等待直到 id 为 "my-id" 的元素可编辑。

8. **等待元素被选中**:`waitFor({ state: 'checked' })` 方法可以用于等待元素被选中。例如,`page.locator('#my-id').waitFor({ state: 'checked' })` 会等待直到 id 为 "my-id" 的元素被选中。

这些都是 Playwright 中 `page.locator()` 方法的一些更高级的用法和技巧。通过熟练掌握这些方法,你可以更有效地定位和操作网页上的元素。
----------------------------------------------------------------------------------------

在 Playwright 中,Locator 是自动等待和重试机制的核心部分。简单来说,Locator 提供了在任何时刻在页面上找到元素的方法。可以使用 page.locator() 方法创建一个 Locator

Locator 对象的主要优点是它们可以自动等待元素出现在页面上。例如,如果你创建了一个 Locator,然后立即尝试点击它,但是这个元素还没有出现在页面上,Playwright 会自动等待这个元素出现,然后再执行点击操作。

此外,Locator 对象还可以重试操作。例如,如果你尝试点击一个 Locator,但是这个元素在被点击的瞬间消失了,Playwright 会自动重试点击操作,直到操作成功或超时。
以下是一些使用 Locator 对象方法的示例:

# 创建一个 Locator
locator = page.locator('#my-id')# 点击 Locator
locator.click()# 填充 Locator
locator.fill('Hello, world!')# 获取 Locator 的文本
text = locator.text_content()# 获取 Locator 的 HTML
html = locator.inner_html()# 等待 Locator 出现在页面上
locator.wait_for()# 等待 Locator 从页面上消失
locator.wait_for('hidden')

以下是 `Locator` 对象的方法和属性的简单解释:

---Methods---

- `all`: 返回所有匹配的元素。
- `all_inner_texts`: 返回所有匹配元素的内部文本。
- `all_text_contents`: 返回所有匹配元素的文本内容。

- `and_`: 创建一个新的 `Locator`,它匹配同时满足当前 `Locator` 和另一个条件的元素。
- `blur`: 让匹配的元素失去焦点。
- `bounding_box`: 返回匹配元素的边界框。
- `check`: 勾选匹配的元素(如果它是一个复选框或单选框)。
- `clear`: 清除匹配元素的输入值(如果它是一个输入元素)。
- `click`: 点击匹配的元素。
- `count`: 返回匹配元素的数量。
- `dblclick`: 双击匹配的元素。
- `dispatch_event`: 在匹配的元素上分发一个事件。
- `drag_to`: 将匹配的元素拖动到另一个位置。
- `evaluate`: 在匹配的元素上执行一个 JavaScript 函数。
- `evaluate_all`: 在所有匹配的元素上执行一个 JavaScript 函数。
- `evaluate_handle`: 获取一个可以在匹配的元素上执行 JavaScript 的句柄。
- `fill`: 填充匹配元素的输入值(如果它是一个输入元素)。

- `filter`: 创建一个新的 `Locator`,它匹配满足一个函数的元素。
- `focus`: 让匹配的元素获取焦点。
- `frame_locator`: 返回匹配元素的 `FrameLocator`(如果它是一个 `iframe` 元素)。
- `get_attribute`: 获取匹配元素的属性值。
- `get_by_alt_text`: 创建一个新的 `Locator`,它匹配 `alt` 属性包含指定文本的元素。
- `get_by_label`: 创建一个新的 `Locator`,它匹配 `label` 属性包含指定文本的元素。
- `get_by_placeholder`: 创建一个新的 `Locator`,它匹配 `placeholder` 属性包含指定文本的元素。
- `get_by_role`: 创建一个新的 `Locator`,它匹配 `role` 属性包含指定文本的元素。
- `get_by_test_id`: 创建一个新的 `Locator`,它匹配 `data-testid` 属性包含指定文本的元素。
- `get_by_text`: 创建一个新的 `Locator`,它匹配文本包含指定文本的元素。
- `get_by_title`: 创建一个新的 `Locator`,它匹配 `title` 属性包含指定文本的元素。
- `highlight`: 高亮匹配的元素。
- `hover`: 将鼠标悬停在匹配的元素上。
- `inner_html`: 获取匹配元素的内部 HTML。
- `inner_text`: 获取匹配元素的内部文本。

- `input_value`: 获取匹配元素的输入值(如果它是一个输入元素)。
- `is_checked`: 检查匹配的元素是否被勾选(如果它是一个复选框或单选框)。
- `is_disabled`: 检查匹配的元素是否被禁用。
- `is_editable`: 检查匹配的元素是否可编辑。
- `is_enabled`: 检查匹配的元素是否启用。
- `is_hidden`: 检查匹配的元素是否隐藏。
- `is_visible`: 检查匹配的元素是否可见。
- `locator`: 创建一个新的 `Locator`,它匹配满足一个定位器的元素。
- `nth`: 创建一个新的 `Locator`,它匹配第 n 个元素。
- `or_`: 创建一个新的 `Locator`,它匹配满足当前 `Locator` 或另一个条件的元素。
- `press`: 在匹配的元素上按下一个键(如果它是一个输入元素)。
- `press_sequentially`: 在匹配的元素上按下一系列的键(如果它是一个输入元素)。
- `screenshot`: 对匹配的元素进行截图。
- `scroll_into_view_if_needed`: 如果需要,将匹配的元素滚动到视图中。
- `select_option`: 选择匹配的元素的一个选项(如果它是一个 `select` 元素)。
- `select_text`: 选择匹配的元素的文本(如果它是一个输入元素或 `textarea` 元素)。
- `set_checked`: 设置匹配的元素的勾选状态(如果它是一个复选框或单选框)。
- `set_input_files`: 设置匹配的元素的输入文件(如果它是一个文件输入元素)。
- `tap`: 在匹配的元素上进行触摸操作。
- `text_content`: 获取匹配元素的文本内容。
- `uncheck`: 取消勾选匹配的元素(如果它是一个复选框或单选框)。
- `wait_for`: 等待匹配的元素满足一个条件。

---Properties---

- `first`: 返回第一个匹配的元素。
- `last`: 返回最后一个匹配的元素。
- `page`: 返回关联的 `Page` 对象。

这些方法和属性使 `Locator` 对象能够执行各种操作,包括查找元素、与元素交互、获取元素的信息等。

这篇关于Playwright中locator() 方法快速定位网页元素[全面总结]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/821725

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

电脑桌面文件删除了怎么找回来?别急,快速恢复攻略在此

在日常使用电脑的过程中,我们经常会遇到这样的情况:一不小心,桌面上的某个重要文件被删除了。这时,大多数人可能会感到惊慌失措,不知所措。 其实,不必过于担心,因为有很多方法可以帮助我们找回被删除的桌面文件。下面,就让我们一起来了解一下这些恢复桌面文件的方法吧。 一、使用撤销操作 如果我们刚刚删除了桌面上的文件,并且还没有进行其他操作,那么可以尝试使用撤销操作来恢复文件。在键盘上同时按下“C

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的