centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决

本文主要是介绍centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景说明

实验室集群环境系统更新,导致之前的Infiniband网卡驱动不可用了,因此安装新的驱动

详细步骤

1.去官网下载指定版本

下载安装包
官网版本列表
我这里下载的是对应的7.4
支持Centos7.4的驱动

ps:查看自己系统版本的命令:

lsb_release -a

或者:

cat /etc/redhat-release
2.查看支持情况

解压刚下载的MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64.tgz

tar -zxvf MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64.tgz

进入MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64下执行 cat .supported_kernels 可以查看支持的内核版本:

cat .supported_kernels

通过命令uname -a查看系统当前版本:

uname -a

ps:如果不支持当前版本,可以升级内核或者添加针对当前内核版本的IB驱动(一般第一步下载对应正确的版本都会支持的)

3.安装驱动

进入MLNX_OFED_LINUX-4.2-1.2.0.0-rhel7.4-x86_64目录执行:

./mlnxofedinstall

ps:在这个过程中可能会出现缺少依赖的包,根据提示直接用yum安装即可。

4.启动服务
/etc/init.d/openibd start

或者

service openibd start

启动子网管理器opensmd并设为开机启动:

service opensmd start

设置开机启动:

chkconfig openibd on
chkconfig opensmd on

ps:启动的时候如果说要unload一些模块,根据提示unload即可

5.写在后面

至此安装完毕,可以通过命令ibstat查看ib卡状态

ibstat

如果status为Active即成功!

或者通过ifconfig查看网络情况,不出意外可以看到ib卡的流量信息。

ps:安装完成之后,在需要使用ib卡交换的地方改成本机ib卡的ip即可,例如修改其他机器NFS服务的挂载ip地址

mount -t nfs 12.12.12.29:/datas /data-nfs

我这里的ip是IB卡的的ip,/data-nfs是我自定义的目录。

——————————————————————————————————————————————————————————————————————————————- 我是分割线—————————————————- 2018.02.02更新

机器重启了一下,ib网卡启动失败,重启驱动报一堆类似的错误:

Module xxx belong to kernel which is not a part of MLNX[FAILED]kipping...

查看官方文档发现解释如下:

When MLNX_OFED modules are not compatible with a new kernel from a new OS or errata kernel, no links will be created under the weak-updates directory for the new kernel, causing the driver load to fail. Checking for the existence of needed module links under weak-updates directory can be done by reloading the MLNX_OFED modules. If one or more modules are missing, the driver reload will fail with an error message.

大概意思就是:
当MLNX_OFED模块勘误内核或者新内核不兼容时,新内核的weak-updates目录下将不会创建任何链接,导致驱动程序加载失败。 检查weak-updates目录下是否存在需要的模块链接可以通过重新加载MLNX_OFED模块来完成。 如果缺少一个或多个模块,则驱动程序重新加载将失败,并显示错误消息。
文档也说了其原因是:
RedHat的MLNX_OFED软件包附带支持KMP(弱模块)的RPM,这意味着当安装新的勘误内核时,将在新内核的weak-updates目录下创建兼容性链接。 这些链接允许使用现有的MLNX_OFED内核模块而不需要重新编译。 但是,有时新内核的ABI可能与MLNX_OFED模块不兼容,这将阻止加载它们。 在这种情况下,MLNX_OFED模块必须针对新内核重新构建。

解决办法:
在上述步骤的基础上使用如下命令安装驱动:

# cd <MLNX_OFED dir>
# ./mlnxofedinstall --skip-distro-check --add-kernel-support --kmp --force

安装过程如果缺少依赖,根据提示使用yum安装即可,安装完成后重启,问题解决。

这篇关于centos7.4安装Infiniband网卡驱动以及“Module xxx belong to kernel which is not a part of MLNX……”错误解决的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/667703

相关文章

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

mybatis和mybatis-plus设置值为null不起作用问题及解决

《mybatis和mybatis-plus设置值为null不起作用问题及解决》Mybatis-Plus的FieldStrategy主要用于控制新增、更新和查询时对空值的处理策略,通过配置不同的策略类型... 目录MyBATis-plusFieldStrategy作用FieldStrategy类型每种策略的作

Python Jupyter Notebook导包报错问题及解决

《PythonJupyterNotebook导包报错问题及解决》在conda环境中安装包后,JupyterNotebook导入时出现ImportError,可能是由于包版本不对应或版本太高,解决方... 目录问题解决方法重新安装Jupyter NoteBook 更改Kernel总结问题在conda上安装了

Goland debug失效详细解决步骤(合集)

《Golanddebug失效详细解决步骤(合集)》今天用Goland开发时,打断点,以debug方式运行,发现程序并没有断住,程序跳过了断点,直接运行结束,网上搜寻了大量文章,最后得以解决,特此在这... 目录Bug:Goland debug失效详细解决步骤【合集】情况一:Go或Goland架构不对情况二:

解决jupyterLab打开后出现Config option `template_path`not recognized by `ExporterCollapsibleHeadings`问题

《解决jupyterLab打开后出现Configoption`template_path`notrecognizedby`ExporterCollapsibleHeadings`问题》在Ju... 目录jupyterLab打开后出现“templandroidate_path”相关问题这是 tensorflo

如何解决Pycharm编辑内容时有光标的问题

《如何解决Pycharm编辑内容时有光标的问题》文章介绍了如何在PyCharm中配置VimEmulator插件,包括检查插件是否已安装、下载插件以及安装IdeaVim插件的步骤... 目录Pycharm编辑内容时有光标1.如果Vim Emulator前面有对勾2.www.chinasem.cn如果tools工

在MySQL执行UPDATE语句时遇到的错误1175的解决方案

《在MySQL执行UPDATE语句时遇到的错误1175的解决方案》MySQL安全更新模式(SafeUpdateMode)限制了UPDATE和DELETE操作,要求使用WHERE子句时必须基于主键或索引... mysql 中遇到的 Error Code: 1175 是由于启用了 安全更新模式(Safe Upd

Python安装时常见报错以及解决方案

《Python安装时常见报错以及解决方案》:本文主要介绍在安装Python、配置环境变量、使用pip以及运行Python脚本时常见的错误及其解决方案,文中介绍的非常详细,需要的朋友可以参考下... 目录一、安装 python 时常见报错及解决方案(一)安装包下载失败(二)权限不足二、配置环境变量时常见报错及