本文主要是介绍Archlinux回滚系统(回滚有风险,慎用),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
回滚前历程
前些天在Arch上配置docker,nvidia-docker使用一直报错,以为是显卡驱动的问题,于是就大意地升级了下系统(sudo pacman -Syu),然后很悲催地升级完后还是不要好用,原来的系统内核是5.5.11,升级之后变成了5.8.12。同样地,软件包也跟着一起更新了,nvidia驱动由之前的440.64变成了450.23,cuda由之前的10.2变成了11.1。
为何要回滚系统?
升级了内核,cuda版本变成了11.1,在运行pytorch程序时会报错,具体错误原因就不贴图了,但是在cuda10.2版本的电脑上运行没有错误,在cpu上运行也没有错误,估计是pytorch暂时不支持cuda11.1,于是去pytorch官网查看,也没有找到适用于cuda11.1版本的pytorch,于是这时我就想着要降低cuda版本。
降低软件包版本,有一个工具是downgrade,使用和安装过程参考这篇文章如何在 Arch Linux 中降级软件包,步骤为:
- 添加一个源:编辑/etc/pacman.conf文件,或者pacman.d文件夹下面的源文件。
[archlinuxfr]
SigLevel = Never
Server = http://repo.archlinux.fr/$arch
- 更新
sudo pacman -Sy
- 安装
sudo pacman -S downgrade
上面3步完成了downgrade安装,就可以使用这个工具了,比如我要降级nvidia包,使用如下:
downgrade nvidia
输入上个命令后,会出现很多版本的nvidia驱动包,如果之前电脑上安装过该版本,会在后面显示(local),如果没有安装过,会显示(remote),因此选择一个之前安装过的版本即可。
如果你通过以上步骤降级nvidia驱动包的话,会发现有冲突,因此需要nvidia和nvidia-utils这两个包一起降级,只需要改个命令即可:
downgrade nvidia nvidia-utils
重点来了,降级之后会显示nvidia驱动和系统内核不一致,具体表现是输入nvidia-smi
命令不能显示显卡运行状态,会报错。于是我就开始尝试降级系统内核版本。
降级内核版本具体参考这篇文章archlinux升级内核后,系统挂了,修复方法,具体思路为:
- 查看安装包缓存
一般使用pacman安装的软件包都会在/var/cache/pacman/pkg/目录下有缓存,因此只需要输入以下命令即可查看:
ls -l /var/cache/pacman/pkg/ | grep linux
- 安装旧内核
选择之前的旧内核,我是通过时间来判断的,安装本地软件包命令如下:
pacman -Udd xxx
安装过后还是不好用,可能得重启,但是我猜想即使安装旧内核成功,也会出现很多软件包与内核冲突的情况,于是这时候我就打算降级全部软件包,包括内核。
降级所有软件包
回滚系统,我是参考archwiki教程来实现的,wiki上介绍的很详细,链接地址为Arch Linux Archive。
主要参考的是这一段。
注意的是,下面已经说明,请谨慎使用该方法,这样降级所有软件包后会出现冲突的情况,不过我还是硬着头皮上了,安装后对我有较大影响的是anaconda环境中的软件包版本冲突了,需要重新安装了。
教程中说得很详细了,但是要注意的是,需要查看repo中对应日期中是否存在软件包,有可能对应日期下是空的。同时还要查看该日期的nvidia驱动是否是所需要的的版本,比如我要安装的是nvidia44.64版本,因此我选择了3.25日期的源。
安装后续
安装成功后,nvidia-smi还是不能使用,查看内核版本uname -a还是5.8.12,这时候需要将服务器重启一下就好了。
重启后nvidia-smi显示的nvidia驱动是44.64,cuda版本是10.2,查看内核版本是5.5.11,打开pytorch,测试gpu能够使用,降级完成。
不过还是不建议使用这种方法,可能后续会有很多问题出现,如果有更好的办法感谢提供。
这篇关于Archlinux回滚系统(回滚有风险,慎用)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!