【C语言】InfiniBand驱动mlx4_register_interface函数

2024-03-11 10:04

本文主要是介绍【C语言】InfiniBand驱动mlx4_register_interface函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、讲解

mlx4_register_interface函数是Mellanox InfiniBand驱动程序的一部分,这个函数的作用是注册一个新的接口(intf)到InfiniBand设备。这允许不同的子系统,如以太网或存储,能够在同一个硬件设备上注册它们各自需要的接口,在硬件资源上建立抽象层。这段代码是从网络驱动的源代码中取出来的,具体的操作流程是这样的:
1. 参数检查: 该函数首先检查传入的接口(intf)是否有`add`和`remove`方法。这两个方法是必须的,因为它们被驱动用来添加和移除设备。如果其中一个方法缺失,函数返回`-EINVAL`,表示一个无效的参数错误。
2. 互斥锁保护: 函数使用了互斥锁`intf_mutex`来确保在修改接口列表(intf_list)时不会有并发问题。
3. 更新接口列表: 函数将`intf`加入到全局的接口列表,使用`list_add_tail`函数把接口添加到列表的尾部。
4. 遍历设备列表: 接下来使用`list_for_each_entry`来遍历当前已注册的设备列表`dev_list`。
5. 多功能设备检查: 在遍历时,对于每个设备`priv`,它会检查是否是一个多功能(multifunction)设备,并且是否接口标志(intf->flags)包含了绑定(BONDING)的属性。如果是这样,它会通过日志输出调试信息,并清除接口标志中的绑定属性。
6. 添加设备: 调用`mlx4_add_device`函数来实际将接口添加到设备。这通常涉及调用接口的`add`方法。
7. 解锁: 最后,函数解锁互斥锁`intf_mutex`。
8. 返回值: 如果一切顺利,函数将返回`0`,表示成功。
这个函数没有直接使用特定的PCIe函数,它是驱动程序高级接口注册流程的一部分。但它关联的操作可能间接地与PCIe有关,因为InfiniBand驱动程序底层可能需要与PCIe硬件交互来执行任务,如访问硬件资源、配置硬件等。这通常涉及读取和写入PCIe配置空间、映射内存空间、处理中断等任务,可能使用诸如`pci_read_config_*, pci_write_config_*, pci_enable_device`, pci_set_master, pci_alloc_irq_vectors, pci_iomap, pci_set_drvdata等PCIe底层函数。
最后需要注意的是,这段代码是内核的一部分,并且使用GPL协议发布,所以任何在此代码基础上的开发或修改,都必须遵循GPL协议。

二、中文注释

这段代码是Linux内核代码的一部分,在kernel-4.9\drivers\net\ethernet\mellanox\mlx4\intf.c文件中,与Mellanox技术有关的mlx4网络驱动程序。这个特定的函数`mlx4_register_interface`的目的是注册一个网络接口到mlx4驱动。以下是对每一部分的中文注释:

// 定义 mlx4_register_interface 函数,它需要一个指向 mlx4_interface 结构体的指针作为参数
int mlx4_register_interface(struct mlx4_interface *intf)
{// 声明一个指向 mlx4_priv 结构体的指针struct mlx4_priv *priv;// 如果接口的 add 或 remove 函数指针为空,则返回 -EINVAL(无效的参数错误)if (!intf->add || !intf->remove)return -EINVAL;// 锁定 intf_mutex 保护全局变量在多线程中被安全访问mutex_lock(&intf_mutex);// 在全局接口列表 intf_list 的末尾添加新接口list_add_tail(&intf->list, &intf_list);// 遍历 dev_list 中的每个条目(即 mlx4_priv 设备列表)list_for_each_entry(priv, &dev_list, dev_list) {// 检查是否启用了多功能(multi-function)并且接口的 flags 包含 BONDING 标志if (mlx4_is_mfunc(&priv->dev) && (intf->flags & MLX4_INTFF_BONDING)) {// 打印调试信息,表明对于多功能设备,要禁用 HA(高可用)模式mlx4_dbg(&priv->dev,"SRIOV, disabling HA mode for intf proto %d\n", intf->protocol);// 清除 intf 的 BONDING 标志intf->flags &= ~MLX4_INTFF_BONDING;}// 为当前遍历到的设备 priv 添加这个接口mlx4_add_device(intf, priv);}// 解锁保护全局变量 intf_mutexmutex_unlock(&intf_mutex);// 返回 0 表示函数成功完成return 0;
}
// 向内核导出 mlx4_register_interface 符号,使其可以被模块 GPL 兼容地使用
EXPORT_SYMBOL_GPL(mlx4_register_interface);

这个函数的具体流程是:
1. 检查 intf 指定的接口结构是否有必要的 add 和 remove 函数。
2. 锁定 intf_mutex 以保护全局的 intf_list 在多线程环境下的修改。
3. 将 intf 接口添加到 intf_list 链表的末尾。
4. 遍历 dev_list 链表,检查每个设备是否为多功能设备并且是否有配对标志;如有,禁用高可用模式。
5. 对每个设备调用 mlx4_add_device 函数将这个接口添加到设备。
6. 解锁 intf_mutex。
7. 函数返回,表示接口注册成功。 

三、mlx4_add_device

// 定义一个名为 mlx4_add_device 的函数,它接收指向 mlx4_interface 结构和 mlx4_priv 结构的指针作为参数。
static void mlx4_add_device(struct mlx4_interface *intf, struct mlx4_priv *priv)
{struct mlx4_device_context *dev_ctx; // 定义一个指向 mlx4_device_context 结构的指针变量。// 使用 kmalloc 函数分配内存给 dev_ctx,大小为一个 mlx4_device_context 结构的大小。// GFP_KERNEL 标志表示正常的内核内存分配方式。dev_ctx = kmalloc(sizeof(*dev_ctx), GFP_KERNEL);if (!dev_ctx)return; // 如果内存分配失败,则直接返回。// 初始化 dev_ctx 结构体的成员。dev_ctx->intf    = intf; // 赋值接口指针。dev_ctx->context = intf->add(&priv->dev); // 调用 intf 的 add 方法,并将结果存储在 context 中。// 检查是否成功获得了 context。if (dev_ctx->context) {// 使用 spin_lock_irq 来锁定 priv->ctx_lock,禁止中断,避免 race condition。spin_lock_irq(&priv->ctx_lock);// 将 dev_ctx 加入到 priv->ctx_list 链表的尾部。list_add_tail(&dev_ctx->list, &priv->ctx_list);// 解锁。spin_unlock_irq(&priv->ctx_lock);// 如果 intf 结构体中定义了 activate 回调方法,则调用它。if (intf->activate)intf->activate(&priv->dev, dev_ctx->context);} else // 如果获取 context 失败,则释放之前分配的内存。kfree(dev_ctx);
}

上述代码通常应该是 Linux 内核的一部分,具体是 Mellanox 网络设备驱动程序的代码。代码的功能是向驱动程序注册一个新的设备,并建立需要的设备上下文。如果在建立上下文(比如分配内存或者初始化结构)时失败了,它会清理所用的资源并退出。如果成功,它会将该设备上下文添加到一个全局的链表中,并且调用激活回调(如果提供了的话)。

这段代码是一个用于Linux网络驱动中,Mellanox设备的一部分。这个函数的主要作用是将一个新的设备添加到特定的接口(interface)。
函数签名解释:
static void mlx4_add_device(struct mlx4_interface *intf, struct mlx4_priv *priv)
- static: 函数的作用域是该文件内部。
- void: 函数没有返回值。
- mlx4_add_device: 函数名称,意味着“添加mlx4设备”。
- struct mlx4_interface *intf: 函数的第一个参数,一个指向`mlx4_interface`结构体的指针。这表示与设备通讯的接口。
- struct mlx4_priv *priv: 函数的第二个参数,一个指向`mlx4_priv`结构体(包含私有数据)的指针。
函数的工作流程解释:
1. kmalloc用于动态分配内存。这里分配了一个`mlx4_device_context`结构体的内存。`GFP_KERNEL`参数是告诉内核这次分配是可以睡眠的,如果当前没有足够的内存,可以等待。
2. 如果`kmalloc`返回NULL,代表内存分配失败,函数直接返回。
3. 分配成功后,开始初始化`dev_ctx`结构体的成员:指向接口的指针`intf`和通过接口提供的`add`函数回调来获得的设备上下文`context`。
4. 如果`context`不是NULL,表示设备已成功添加。
5. 函数通过获得`ctx_lock`自旋锁来保护并发访问`priv`结构体的`ctx_list`列表。
6. 使用`list_add_tail`将`dev_ctx`添加到`priv`的`ctx_list`列表尾部。
7. 释放自旋锁,允许其他代码运行。
8. 如果`intf`结构体提供了一个`activate`函数指针,调用这个函数激活设备。
9. 如果设备上下文没有成功创建,释放之前分配的`dev_ctx`结构体的内存来避免内存泄漏。
总结:这个函数处理将一个新的设备添加到一个网络接口,并在添加成功时可能触发设备的激活过程。如果添加失败,则清理资源以避免内存泄漏。 

这篇关于【C语言】InfiniBand驱动mlx4_register_interface函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/797491

相关文章

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

Linux_kernel驱动开发11

一、改回nfs方式挂载根文件系统         在产品将要上线之前,需要制作不同类型格式的根文件系统         在产品研发阶段,我们还是需要使用nfs的方式挂载根文件系统         优点:可以直接在上位机中修改文件系统内容,延长EMMC的寿命         【1】重启上位机nfs服务         sudo service nfs-kernel-server resta

C++操作符重载实例(独立函数)

C++操作符重载实例,我们把坐标值CVector的加法进行重载,计算c3=c1+c2时,也就是计算x3=x1+x2,y3=y1+y2,今天我们以独立函数的方式重载操作符+(加号),以下是C++代码: c1802.cpp源代码: D:\YcjWork\CppTour>vim c1802.cpp #include <iostream>using namespace std;/*** 以独立函数

函数式编程思想

我们经常会用到各种各样的编程思想,例如面向过程、面向对象。不过笔者在该博客简单介绍一下函数式编程思想. 如果对函数式编程思想进行概括,就是f(x) = na(x) , y=uf(x)…至于其他的编程思想,可能是y=a(x)+b(x)+c(x)…,也有可能是y=f(x)=f(x)/a + f(x)/b+f(x)/c… 面向过程的指令式编程 面向过程,简单理解就是y=a(x)+b(x)+c(x)

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,