IOS 自动化探索——使用蓝牙实现 XCUITest 的 Tap 操作

2024-03-25 23:08

本文主要是介绍IOS 自动化探索——使用蓝牙实现 XCUITest 的 Tap 操作,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文由 自然生长 发表于TesterHome社区,点击 原文链接 可与作者直接交流。

一、前言

远程使用 WeTest 和 Testin 的 ios 设备时,总会觉得操作不流畅,因为它在松开鼠标时, 手机才会动。应该是由于 WDA 中是使用 XCUITest 来实现 Tap 操作,而它的一次操作需要完整的动作链,不能像 Android 中一样分解为 Down、Move、Up 操作。

最近发现了一款名叫虫洞的软件,地址:https://er.run/ ,它可以实现流畅的远程操作。进过研究,发现其原理是通过蓝牙向手机发送蓝牙鼠标操作信号,从而实现一个指针设备来操控设备。

目前只实现了一个 DEMO,在实用性方面还有待提高。

二、基础知识

1、蓝牙 HID 设备

The Human Interface Device (HID) 定义了蓝牙在人机接口设备中的协议、特征和使用规程。典型的应用包括蓝牙鼠标、蓝牙键盘、蓝牙游戏手柄等。该协议改编自 USB HID Protocol。

HID 建立 Control Channel 和 Interrupt Channel 两个通道,Control Channel 通道主要用于传输控制封包,在这个通道传输的封包称为同步封包(synchronous reports),Interrupt Channel 通道传输的封包不需要确认,所以称为异步封包(asynchronous reports)。

不同的设备发送的包是不同的,下文会列举键盘的包和鼠标的包。

2、蓝牙 SDP 协议

SDP 协议让客户机的应用程序发现存在的服务器应用程序提供的服务以及这些服务的属性。SDP 只提供发现服务的机制,不提供使用这些服务的方法。每个蓝牙设备都需要一个 SDP Service,只做 Client 的蓝牙设备除外。

3、蓝牙鼠标信号

和使用 XCUITest 最大的不同是蓝牙鼠标移动的 xy 位置不是屏幕的位置,而是鼠标当前点的相对位置,这点对于实现 Tap 操作是不利的,因为需要将相对位置转换成在屏幕中的绝对位置。

4、IOS 中的辅助控制

与蓝牙键盘不同,支持蓝牙鼠标功能是需要主动开启的,位置在 设置>辅助功能>触控>辅助功能,当蓝牙鼠标信号成功发送后,在手机上会出现一个小圆点,在设置>辅助功能>触控>辅助功能>设备 中也会出现该蓝牙设备。

三、具体实现

1、基础源码

地址:https://github.com/bonyadmitr/XcodeProjects/tree/de6f1b11b2c847b30b900c8a2539e0a30a06c7ba/_mac/Bluetooth-Keyboard-Emulator

这个项目支持 Swift5,但只实现了模拟蓝牙键盘的功能,只要跑起来后,将手机通过蓝牙连接到你的 Mac,然后就能读取你 Mac 的键盘输入转到手机中。PS:Monterey 的蓝牙连接似乎有些问题,ios 设备根本连不上蓝牙。

2、修改 SDP,加入鼠标 Report 结构

在项目中有个 HIDReportDescriptor.txt 的文件,可以看到其中有键盘的 Report 结构,这是需要加在 sdp 协议中的,但它并不是 sdp 协议文件,真正的 sdp 文件是 SerialPortDictionary.plist。

0206 - HIDDescriptorList > item 0 > item 1 > DataElementValue 中是 HIDReportDescriptor.txt 的 Hex 格式,将鼠标的 Report 结构加入其中即可。

3、定义鼠标 Report

我们先看下它已经定义好的键盘 report,需要结合 HIDReportDescriptor.txt 来看。

let bytes: [UInt8] = [0xA1,      // 0 DATA | INPUT (HIDP Bluetooth)0x01,      // 1 Report IDmodifier,  // 2 Modifier Keys0x00,      // 3 ReservedkeyCode,   // 4 Keys ( 6 keys can be held at the same time )0x00,      // 50x00,      // 60x00,      // 70x00,      // 80x00,      // 90x00       // 10 Reserved
]

其中第一个字节 A1 代表它是 HID 设备,第二个字节 Report ID 01 代表是键盘,可以对应0x85, 0x01, // Report ID (1)

接下来 modifier 代表的是功能键,可以表示同时按下多个功能键,例如 0b1 代表按下 control 健,0b10 代表按下 shift 键,0b11 代表同时按下了 control 和 shift 键。

下面第 3 个字节虽然注释上标记了保留字段,但其实它是有意义的,但只在输出时有用,它表示了一些锁,比如大小写锁和小键盘锁。

0x05, 0x08,        //   Usage Page (LEDs)
0x19, 0x01,        //   Usage Minimum (Num Lock)
0x29, 0x05,        //   Usage Maximum (Kana)
0x95, 0x05,        //   Report Count (5)
0x75, 0x01,        //   Report Size (1)
0x91, 0x02,        //   Output (Data,Var,Abs,No Wrap,Linear,Preferred State,No Null Position,Non-volatile)
0x95, 0x01,        //   Report Count (1)
0x75, 0x03,        //   Report Size (3)
0x91, 0x01,        //   Output (Const,Array,Abs,No Wrap,Linear,Preferred State,No Null Position,Non-volatile)

第 4 到 9 字节代表了按键,可以同时按下 6 个键,这个项目中只支持 1 个。

0x05, 0x07,        //   Usage Page (Kbrd/Keypad)
0x19, 0x00,        //   Usage Minimum (0x00)
0x2A, 0xFF, 0x00,  //   Usage Maximum (0xFF)
0x95, 0x06,        //   Report Count (6)
0x75, 0x08,        //   Report Size (8)

第 10 个字节是保留字段。

0x05, 0xFF,        //   Usage Page (Reserved 0xFF)
0x09, 0x03,        //   Usage (0x03)
0x75, 0x08,        //   Report Size (8)
0x95, 0x01,        //   Report Count (1)

由此可以通过网上找到的鼠标的 Report 结构来写成项目中的包格式。

0x05, 0x01,        // Usage Page (Generic Desktop Ctrls)
0x09, 0x02,        // Usage (Mouse)
0xA1, 0x01,        // Collection (Application)
0x85, 0x02,        //   Report ID (2)
0x09, 0x01,        //   Usage (Pointer)
0xA1, 0x00,        //   Collection (Physical)0x05, 0x09,        //     Usage Page (Button)
0x19, 0x01,        //     Usage Minimum (0x01)
0x29, 0x03,        //     Usage Maximum (0x03)
0x15, 0x00,        //     Logical Minimum (0)
0x25, 0x01,        //     Logical Maximum (1)
0x75, 0x01,        //     Report Size (1)
0x95, 0x03,        //     Report Count (3)
0x81, 0x02,        //     Input (Data,Var,Abs,No Wrap,Linear,Preferred State,No Null Position)
0x75, 0x05,        //     Report Size (5)
0x95, 0x01,        //     Report Count (1)
0x81, 0x01,        //     Input (Const,Array,Abs,No Wrap,Linear,Preferred State,No Null Position)0x05, 0x01,        //     Usage Page (Generic Desktop Ctrls)
0x09, 0x30,        //     Usage (X)
0x09, 0x31,        //     Usage (Y)
0x09, 0x38,        //     Usage (Wheel)
0x15, 0x81,        //     Logical Minimum (-127)
0x25, 0x7F,        //     Logical Maximum (127)
0x75, 0x08,        //     Report Size (8)
0x95, 0x03,        //     Report Count (3)
0x81, 0x06,        //     Input (Data,Var,Rel,No Wrap,Linear,Preferred State,No Null Position)0xC0,              //   End Collection
0xC0,              // End Collection

可以看出 Report ID 变成了了 2,接下来的 1 个字节(3+1*5 bit)代表了鼠标的按键,最后三个字节分别代表 X、Y 和 Wheel 移动的距离,同时也是带符号的。

所以,鼠标的格式可以定义为下:

let bytes: [Int8] = [
//           0b10100001,      // 0 DATA | INPUT (HIDP Bluetooth)-0b01011111,0x02,    // 0 Report IDAction,  // 0 just move 1 left_button 2 middle_button 3 right_buttonRel_X,   // xRel_Y,   // y0x00     // scroll]

为了方便表示 xy 的负数,所以定义成了 Int8 格式,第一个字节也从 UInt8 的 0xA1 变成了 Int8 格式。

由于原先的 sendBytes 方法只支持 [UInt8] 参数,所以需要改成泛型方法 sendBytes(channel: IOBluetoothL2CAPChannel, _ bytes: [T])

4、操作方法

先定义一个 sendMouse 方法

func sendMouse(Action: Int8, Rel_X: Int8, Rel_Y: Int8){sendData(bytes: hidMouseReport(Action: Action, Rel_X: Rel_X, Rel_Y: Rel_Y))
}

Action 为 0 时是移动光标,Action 为 1 时是按下,在按住的过程中,所有操作的 Action 都是 1,当发送 Action 为 0 的包时视为松开操作。

如果想快速体验,可以将键盘触发绑定发送此方法,也可以在程序中循环一段操作。

四、总结

目前只是初步实现了这个想法,后续还有很多工作要做,比如:
1、实现对外的访问接口,例如实现 socket 服务或者 rpc 来让外部调用控制方法。
2、设备管理,多个蓝牙设备之间的控制不能冲突,同时能识别指定的蓝牙设备。
3、封装操作,将原子操作 sendMouse 封装成 Down、Move 和 Up 操作,根据指针的相对位置换算成屏幕的绝对位置,这样就能方便的接到已有的自动化流程中。

原文由 自然生长 发表于TesterHome社区,点击 原文链接 可与作者直接交流。

以上是今天的分享,你学废了吗~
想学习更多干货知识和前沿技术?
想结识测试行业大咖和业界精英?
欢迎关注2022 MTSC大会(第十届中国互联网测试开发大会)>>>

这篇关于IOS 自动化探索——使用蓝牙实现 XCUITest 的 Tap 操作的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/846548

相关文章

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

使用Python实现高效的端口扫描器

《使用Python实现高效的端口扫描器》在网络安全领域,端口扫描是一项基本而重要的技能,通过端口扫描,可以发现目标主机上开放的服务和端口,这对于安全评估、渗透测试等有着不可忽视的作用,本文将介绍如何使... 目录1. 端口扫描的基本原理2. 使用python实现端口扫描2.1 安装必要的库2.2 编写端口扫

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

MySQL分表自动化创建的实现方案

《MySQL分表自动化创建的实现方案》在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低,分表是一种有效的优化策略,它将数据分散存储在... 目录一、项目目的二、实现过程(一)mysql 事件调度器结合存储过程方式1. 开启事件调度器2. 创

使用Python实现操作mongodb详解

《使用Python实现操作mongodb详解》这篇文章主要为大家详细介绍了使用Python实现操作mongodb的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、示例二、常用指令三、遇到的问题一、示例from pymongo import MongoClientf

SQL Server使用SELECT INTO实现表备份的代码示例

《SQLServer使用SELECTINTO实现表备份的代码示例》在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误,在SQLServer中,可以使用SELECTINT... 在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误。在 SQL Server 中,可以使用 SE

使用Python合并 Excel单元格指定行列或单元格范围

《使用Python合并Excel单元格指定行列或单元格范围》合并Excel单元格是Excel数据处理和表格设计中的一项常用操作,本文将介绍如何通过Python合并Excel中的指定行列或单... 目录python Excel库安装Python合并Excel 中的指定行Python合并Excel 中的指定列P

基于Go语言实现一个压测工具

《基于Go语言实现一个压测工具》这篇文章主要为大家详细介绍了基于Go语言实现一个简单的压测工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录整体架构通用数据处理模块Http请求响应数据处理Curl参数解析处理客户端模块Http客户端处理Grpc客户端处理Websocket客户端

浅析Rust多线程中如何安全的使用变量

《浅析Rust多线程中如何安全的使用变量》这篇文章主要为大家详细介绍了Rust如何在线程的闭包中安全的使用变量,包括共享变量和修改变量,文中的示例代码讲解详细,有需要的小伙伴可以参考下... 目录1. 向线程传递变量2. 多线程共享变量引用3. 多线程中修改变量4. 总结在Rust语言中,一个既引人入胜又可

Java CompletableFuture如何实现超时功能

《JavaCompletableFuture如何实现超时功能》:本文主要介绍实现超时功能的基本思路以及CompletableFuture(之后简称CF)是如何通过代码实现超时功能的,需要的... 目录基本思路CompletableFuture 的实现1. 基本实现流程2. 静态条件分析3. 内存泄露 bug