高性能网络SIG月度动态:自研 IPPROTO_SMC 贡献 Linux 社区,virtio 增加多项优化

本文主要是介绍高性能网络SIG月度动态:自研 IPPROTO_SMC 贡献 Linux 社区,virtio 增加多项优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

高性能网络 SIG(Special Interest Group) :在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络性能。

一、整体进展

本月高性能网络 SIG 的主要工作聚焦在 ANCK virtio 以及 SMC 上。

本月关键进展

1. ANCK 5.10 内核 virtio-net 新增支持设备状态统计、control vq timeout 和队列重置能力,并优化了控制通道性能。

2. SIG 将自研的 IPPROTO_SMC 方案贡献给上游社区,目前已经获取 Linux 社区认可。

二、ANCK 通用内核网络协议栈

修复

ANCK 5.10 修复 inet_diag() 中潜在数据竞争的问题 (RP3173),预计随着 017 版本发布。

三、SMC

本月 SIG 在 SMC 上的工作主要聚焦于推动 IPPROTO_SMC 方案进入上游主线以及缺陷修复。

IPPROTO_SMC

IPPROTO_SMC[1] 是 SIG 为 IP 协议族新增的一个协议类型。当用户创建 socket 时,IPPROTO_SMC 用来指示底层网络通信应该使用 SMC 协议,其和 IPPROTO_TCP/IPPROTO_UDP 同级。引入 IPPROTO_SMC 旨在提高 SMC 和 TCP 在功能上的一致性,使 SMC 回退到 TCP 协议后在功能路径上与 TCP 仍然保持一致。基于 IPPROTO_SMC,SMC 能够应用几乎所有为 INET 路径创建的 ebpf 功能,使得 SMC 可以使用 ebpf 非常细粒度的控制,并灵活地将 TCP 连接切换成 SMC 连接。此外,ANCK 还基于 IPPROTO_SMC 优化了 SMC 的回退性能,使其在回退到 TCP 的场景下性能和直接使用 TCP 的短连性能差距最差情况相差不超过 6%。

缺陷修复

SIG 本月修复了 SMC 引用计数泄漏[2]和 sk_{sndbuf|rcvbuf} [3]相关缺陷。

四、virtio

本月高性能网络 SIG 在 virtio 领域的工作主要聚焦于控制通道性能优化,支持 control vq timeout、设备统计计数和队列重置。SIG 已把这些特性贡献到了 Linux 上游社区,同时本月将这些特性都回合到了 ANCK,这些功能都将随 ANCK-017 发布。

控制通道性能优化

virtio-net 的 control vq 目前只能同时处理一个请求,这在很大程度上限制了控制通道的效率和灵活性。例如,NetDIM(网络中断调节)是一个现代网卡广泛支持的特性,其通过发送队列级的配置请求来提升性能。随着队列数量的增加,需要发送的配置请求数量也会相应增加。因此,请求发送的效率直接影响了 netdim 为 virtio-net 带来的性能提升,这对 virtio-net 控制通道提出了更高的性能要求。为了解决此问题,SIG 使用了更轻量的锁替换 control vq 曾使用的全局 netlink 锁,并引入了异步提交请求的机制,这些改进允许 control vq 同时处理多个请求,显著提升了 virtio-net 控制通道处理并发请求的性能,还帮助 virtio-net 基于 netdim 实现更佳的性能表现。

control vq timeout

虚拟机使用 virtio-net 网卡时,通常借助 control vq 来提交设备配置的请求。为了获取请求的处理结果,虚拟机需要轮询检查 control vq,直到接收到响应。然而,若设备一直未及时回应这些请求,虚拟机的 CPU 便会持续在高负荷下轮询,这种情况甚至可能导致整机完全 Hang 住。为了解决此问题,SIG 引入了 control vq timeout 机制:自驱动发送命令开始计时,如果在 timeout 超时时间内,设备仍未返回任何响应结果,驱动则认为该设备可能已经出现故障,进而标记驱动不应发送更多请求。该 timeout 值以 ANCK 内核模块参数的形式提供,默认值为 7 天。

设备统计计数

virtio-net 设备曾经无法获取后端设备的统计信息,这些信息对于用户来说,在分析和解决网络问题时至关重要,而用户只能通过云厂商自定义接口来获取某些信息。为了解决此问题,SIG 此前在 virtio 社区成功完成了 virtio-net 对device stats的支持。本月,SIG 也为 ANCK 正式支持了这项功能。这意味着用户现在可以通过用户空间 ethtool 命令直接获取 virtio-net 设备上的统计信息,为分析网络环境提供更多有价值的信息。

队列重置

队列重置功能允许虚拟机停止特定队列,回收并重新分配其内存资源,然后重新启用该队列。这一能力使得用户能够根据特定场景的需求,使用用户态 ethtool 工具调整虚拟机的队列尺寸 ,以优化时延性能表现。此外,在加载 XDP 程序时,驱动程序可以利用队列重置功能,清除所有接收队列中的旧缓冲区,以减少因预填充缓冲区格式不匹配导致的少量数据包丢失,确保数据传输的连续性和完整性。

相关链接:

[1][PATCH net-next v6 0/3] Introduce IPPROTO_SMC - D. Wythe

[2][PATCH net v2] net/smc: fix neighbour and rtable leak in smc_ib_find_route() - Wen Gu

[3][PATCH net] net/smc: avoid overwriting when adjusting sock bufsizes - Wen Gu

高性能网络 SIG 主页:

High Performance Network SIG - OpenAnolis龙蜥操作系统开源社区

注:更多龙蜥 SIG 月度动态可点击这里查看。

这篇关于高性能网络SIG月度动态:自研 IPPROTO_SMC 贡献 Linux 社区,virtio 增加多项优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1073615

相关文章

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》:本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

一文详解SpringBoot响应压缩功能的配置与优化

《一文详解SpringBoot响应压缩功能的配置与优化》SpringBoot的响应压缩功能基于智能协商机制,需同时满足很多条件,本文主要为大家详细介绍了SpringBoot响应压缩功能的配置与优化,需... 目录一、核心工作机制1.1 自动协商触发条件1.2 压缩处理流程二、配置方案详解2.1 基础YAML

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版,这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日(3 月 27 日)放出了 Beta 版 Ubuntu 25.04 系统镜像,代号“Pluc

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

Linux安装MySQL的教程

《Linux安装MySQL的教程》:本文主要介绍Linux安装MySQL的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux安装mysql1.Mysql官网2.我的存放路径3.解压mysql文件到当前目录4.重命名一下5.创建mysql用户组和用户并修

MySQL中慢SQL优化的不同方式介绍

《MySQL中慢SQL优化的不同方式介绍》慢SQL的优化,主要从两个方面考虑,SQL语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢SQL吧... 目录避免不必要的列分页优化索引优化JOIN 的优化排序优化UNION 优化慢 SQL 的优化,主要从两个方面考虑,SQL 语

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

Linux系统之dns域名解析全过程

《Linux系统之dns域名解析全过程》:本文主要介绍Linux系统之dns域名解析全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、dns域名解析介绍1、DNS核心概念1.1 区域 zone1.2 记录 record二、DNS服务的配置1、正向解析的配置