centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决

本文主要是介绍centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景说明

实验室集群环境系统更新,导致之前的Infiniband网卡驱动不可用了,因此安装新的驱动

详细步骤

1.去官网下载指定版本

下载安装包
官网版本列表
我这里下载的是对应的7.4
支持Centos7.4的驱动

ps:查看自己系统版本的命令:

lsb_release -a

或者:

cat /etc/redhat-release
2.查看支持情况

解压刚下载的MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64.tgz

tar -zxvf MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64.tgz

进入MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64下执行 cat .supported_kernels 可以查看支持的内核版本:

cat .supported_kernels

通过命令uname -a查看系统当前版本:

uname -a

ps:如果不支持当前版本,可以升级内核或者添加针对当前内核版本的IB驱动(一般第一步下载对应正确的版本都会支持的)

3.安装驱动

进入MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64目录执行:

./mlnxofedinstall

ps:在这个过程中可能会出现缺少依赖的包,根据提示直接用yum安装即可。

4.启动服务
/etc/init.d/openibd start

或者

service openibd start

启动子网管理器opensmd并设为开机启动:

service opensmd start

设置开机启动:

chkconfig openibd on
chkconfig opensmd on

ps:启动的时候如果说要unload一些模块,根据提示unload即可

5.写在后面

至此安装完毕,可以通过命令ibstat查看ib卡状态

ibstat

如果status为Active即成功!

或者通过ifconfig查看网络情况,不出意外可以看到ib卡的流量信息。

ps:安装完成之后,在需要使用ib卡交换的地方改成本机ib卡的ip即可,例如修改其他机器NFS服务的挂载ip地址

mount -t nfs 12.12.12.29:/datas /data-nfs

我这里的ip是IB卡的的ip,/data-nfs是我自定义的目录。

——————————————————————————————————————————————————————————————————————————————- 我是分割线—————————————————- 2018.02.02更新

机器重启了一下,ib网卡启动失败,重启驱动报一堆类似的错误:

Module xxx belong to kernel which is not a part of MLNX[FAILED]kipping...

查看官方文档发现解释如下:

When MLNX_OFED modules are not compatible with a new kernel from a new OS or errata kernel, no links will be created under the weak-updates directory for the new kernel, causing the driver load to fail. Checking for the existence of needed module links under weak-updates directory can be done by reloading the MLNX_OFED modules. If one or more modules are missing, the driver reload will fail with an error message.

大概意思就是:
当MLNX_OFED模块勘误内核或者新内核不兼容时,新内核的weak-updates目录下将不会创建任何链接,导致驱动程序加载失败。 检查weak-updates目录下是否存在需要的模块链接可以通过重新加载MLNX_OFED模块来完成。 如果缺少一个或多个模块,则驱动程序重新加载将失败,并显示错误消息。
文档也说了其原因是:
RedHat的MLNX_OFED软件包附带支持KMP(弱模块)的RPM,这意味着当安装新的勘误内核时,将在新内核的weak-updates目录下创建兼容性链接。 这些链接允许使用现有的MLNX_OFED内核模块而不需要重新编译。 但是,有时新内核的ABI可能与MLNX_OFED模块不兼容,这将阻止加载它们。 在这种情况下,MLNX_OFED模块必须针对新内核重新构建。

解决办法:
在上述步骤的基础上使用如下命令安装驱动:

# cd <MLNX_OFED dir>
# ./mlnxofedinstall --skip-distro-check --add-kernel-support --kmp --force

安装过程如果缺少依赖,根据提示使用yum安装即可,安装完成后重启,问题解决。

这篇关于centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/667703

相关文章

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

mysql出现ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (10061)的解决方法

《mysql出现ERROR2003(HY000):Can‘tconnecttoMySQLserveron‘localhost‘(10061)的解决方法》本文主要介绍了mysql出现... 目录前言:第一步:第二步:第三步:总结:前言:当你想通过命令窗口想打开mysql时候发现提http://www.cpp

MySQL Workbench 安装教程(保姆级)

《MySQLWorkbench安装教程(保姆级)》MySQLWorkbench是一款强大的数据库设计和管理工具,本文主要介绍了MySQLWorkbench安装教程,文中通过图文介绍的非常详细,对大... 目录前言:详细步骤:一、检查安装的数据库版本二、在官网下载对应的mysql Workbench版本,要是

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

springboot报错Invalid bound statement (not found)的解决

《springboot报错Invalidboundstatement(notfound)的解决》本文主要介绍了springboot报错Invalidboundstatement(not... 目录一. 问题描述二.解决问题三. 添加配置项 四.其他的解决方案4.1 Mapper 接口与 XML 文件不匹配

Linux安装MySQL的教程

《Linux安装MySQL的教程》:本文主要介绍Linux安装MySQL的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux安装mysql1.Mysql官网2.我的存放路径3.解压mysql文件到当前目录4.重命名一下5.创建mysql用户组和用户并修

Python中ModuleNotFoundError: No module named ‘timm’的错误解决

《Python中ModuleNotFoundError:Nomodulenamed‘timm’的错误解决》本文主要介绍了Python中ModuleNotFoundError:Nomodulen... 目录一、引言二、错误原因分析三、解决办法1.安装timm模块2. 检查python环境3. 解决安装路径问题