如何用GPU算力卡P100玩黑神话悟空?

2024-09-09 08:28
文章标签 gpu 悟空 算力 神话 p100

本文主要是介绍如何用GPU算力卡P100玩黑神话悟空?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

精力有限,只记录关键信息,希望未来能够有助于其他人。

文章目录

  • 综述
  • 背景
  • 评估
    • 游戏性能需求
    • 显卡需求
    • CPU和内存系统需求
    • 主机需求
    • 显式需求
  • 实操
    • 硬件安装
    • 安装操作系统Win11
    • 安装驱动
    • 修改注册表
    • 选择程序使用什么GPU
  • 安装黑神话悟空
  • 其他

综述

用P100 + PCIe Gen3.0 + Dell720服务器(32C64G),运行黑神话悟空画质中等流畅运行。

背景

假设有一张P100-PCIE-16G的 GPU卡。和Dell720服务器。是否能够玩黑神话。
本文记录了从硬件、软件评估,再到实操,再到解决各种软硬件问题最终流畅运行黑神话的过程。
重要的不是玩这个游戏,而是通过一系列技术分析和实操,一步步跑起来。挺有意思的。特此记录。

评估

游戏性能需求

首先黑神话悟空的最低配置是1080P。

显卡需求

如果有P100的GPU卡,P100是帕斯卡架构,对标2080的架构。另外从CUDA核心、显存大小上理论上是可行的,只是没有Tensorcore和Rcore。其中Tensorcore是用来做张量计算,游戏卡不需要。Rcore光线追踪可以不开。
在这里插入图片描述

在这里插入图片描述

CPU和内存系统需求

Dell720服务器是 E5-2670的CPU,2个socket,32核心。
该部分最开始无法确认是否可用,主要考虑2个问题:

  1. 操作系统,包括安装win11系统(不是winserver)。最终常识是可以虽然Win11删除了很多E系列的CPU
  2. CPU的主频是否够,待实测
  3. 内存是否够,内存虽说是服务器内存条不能用在主机上,但是都是内存64G容量是够了。频率还不清楚,包括和GPU互访问的速率
  4. CPU支持的PCIe是3.0,速率最高128GTs,理论上应该是够了,因为毕竟游戏才132G,就算全部加载都可以。

主机需求

功耗:服务器750W单电源,如果不够,可以再加一个电源,所以功耗没问题。
PCIe:插槽和长度,7个可扩展插槽,足够。并且P100本来就在运行。

显式需求

GPU没有显式接口,可以先用主机BMC的VGA显示。后面在考虑添加HDMI。
最后是VGA跑起来了,HDMI是通过加了一张100块钱的显卡搞定显式输出,游戏用GPU运算。

实操

时间有限,简单记录一点。

硬件安装

GPU P100插入服务器,这个本来就在上面,本文忽略。
但需要提的是,Dell服务器每个PCIe slot有8Pin的电源接口,直接买一根GPU的电源线。直接搞定。

安装操作系统Win11

进入BIOS,外加老毛桃等在PE中装机。本文忽略
但是安装后需要通过设备管理器查看到GPU设备,不在显式设备中,而在3D视频卡里面。如果到这一步说明GPU能够被Win11识别。
(了解PCIe协议的,这里的本质是PCIe的总线,能够扫描到GPU P100的配置空间,然后将数据读出来,vendor ID是 15F8,我是通过在Linux上使用过P100知道vendor id是15f8,然后windows中设备管理器的属性中能够看到vendor id也是15f8才确认一定是P100)

安装驱动

这个坑最多,主要2个点。

  1. 安装驱动:NV最新的驱动可以驱动P100,但是关闭了P100将模式从TCC(服务器模式)修改为WDDM(游戏模式)。区别参考兄弟篇:https://blog.csdn.net/essencelite/article/details/141928130
  2. 修改注册表配置

关于可用驱动就直接写链接了 ,如何安装参考官网。不用关注驱动列表中是否支持P100,实际是支持的。
538.67 驱动下载:添加链接描述
本文直接参考本文附录。
在这里插入图片描述

其他坑:
驱动版本528.02不可用
驱动版本552.55不可用
无法下载可以直接在本周后面驱动。
主动安装好以后可以在命令行使用nvidia-smi查看,并且能够看到模式是TCC

修改注册表

打开注册表:“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class{4d36e968-e325-11ce-bfc1-08002be10318}” 目录下根据0000或者0001或者0002,根据系统显卡列表。
可以在DriverDesc字段看是否有P100的描述

修改注册表:
修改:“AdapterType”,类型DWORD32,,从2修改为1
修改:“FeatureScore”,类型DWORD32,,从CF修改为D1 (注意是16进制)
新建:“GridLicensedFeatures”,类型DWORD32,值7
保存注册表。
然后在设备管理器中禁用P100,然后启用P100就会生效。

再次使用nvidia-smi,可以看到显卡模式修改WDDM模式了。
如果有多张NV的卡需要再其他卡里面添加,删除AdapterType,并且添加一个DWORD32位值,命名为EnableMsHybrid,值为1。表示多显卡共存。
然后启用禁用网卡。

选择程序使用什么GPU

进入系统设置->显示设置>点击显示 > 图形设置->显示卡,然后选择对应的程序使用什么GPU

安装黑神话悟空

具体就不介绍了,安装steam-> 购买黑神话悟空->下载安装->运行
最后安装运行能够稳定的运行,并且在任务管理器中的性能标签,能够看到GPU运行中,并且利用率到了80%,成功搞定。
只是需要注意的是,windows的风扇控制不是太好,容易造成GPU太高,可以下载一个风扇插件,或者把机盖稍微打开一点就会全速运行了。
最后运行的几个关键配置情况:

  1. 画质:中等(这个超过想象了,本以为只能用低)
  2. 显示器输出1080P
  3. 运行期间CPU利用率基本在10%一下,GPU利用率在80%左右,GPU显存卡内16G+共享40G,基本只用了十几个G。硬件配置完美搞定。并且PCIe总线的速率和CPU主频都完美搞定。
  4. 运行中屏幕不卡,并且动作也不错。
  5. 不过一点调整到高登记画质,确实就比较卡了。估计只能跑几帧。另外光线追踪确实开不了。

其他

服务器默认显示是VGA,可以买一张百十来块前的小显卡支持1080P的显式基本就能玩起来了。效果还不错。把你的服务器也搞一张P100玩起来吧。
另外显式的问题还可以通过steam串流,使用Pico或者quest的VR眼镜用起来,完美解决服务器显式不足的问题,并且还能巨屏。

最后上2张简单的图吧:
在这里插入图片描述
在这里插入图片描述

参考链接:
https://www.nvidia.cn/data-center/tesla-p100/
https://forums.developer.nvidia.com/t/how-to-open-wddm-mode-supporting-graphics-acceleration-under-windows-for-p100/166994
https://blog.csdn.net/ginys/article/details/139723015

这篇关于如何用GPU算力卡P100玩黑神话悟空?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1150645

相关文章

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

GPU 计算 CMPS224 2021 学习笔记 02

并行类型 (1)任务并行 (2)数据并行 CPU & GPU CPU和GPU拥有相互独立的内存空间,需要在两者之间相互传输数据。 (1)分配GPU内存 (2)将CPU上的数据复制到GPU上 (3)在GPU上对数据进行计算操作 (4)将计算结果从GPU复制到CPU上 (5)释放GPU内存 CUDA内存管理API (1)分配内存 cudaErro

《战锤40K:星际战士2》超越《黑神话》 登Steam热销榜首

《使命召唤:黑色行动6》将登陆 PC Game Pass看来确实影响了销量,因为这次在 Steam 上它的预购并没有占领 Steam 热销榜单之首。这次霸榜的则是即将推出的《战锤40K:星际战士2》。 根据 SteamDB 显示,这部将于9 月 10 日发售的游戏已经面向预购了高级版本的玩家开放了抢先体验,也因此推动了大量的预购销量。该游戏不仅是目前 Steam 上预购最多的游戏,而且还是总体

PyInstaller问题解决 onnxruntime-gpu 使用GPU和CUDA加速模型推理

前言 在模型推理时,需要使用GPU加速,相关的CUDA和CUDNN安装好后,通过onnxruntime-gpu实现。 直接运行python程序是正常使用GPU的,如果使用PyInstaller将.py文件打包为.exe,发现只能使用CPU推理了。 本文分析这个问题和提供解决方案,供大家参考。 问题分析——找不到ONNX Runtime GPU 动态库 首先直接运行python程序

如果出一个名叫白神话悟空的游戏

最近黑神话由于与原著不符引起了原著派的争议。 所以我在摸鱼的时候想到如果游科或者某个别的公司“痛改前非”不夹带私货完全复刻吴承恩百回版剧情制作一个“重走西游路”的游戏,会有一个什么样的销量?(设定为原著派已经多方渠道认证,此游戏的确没有夹带私货,绝大部分复刻了原著剧情) 游戏玩法我想了几类 超长线性有岔路蜈蚣形状地图,蜈蚣的腿部是探索区域和支线,重走西游路线,开篇就是开始取经前唐玄宗御弟cg

麒麟系统安装GPU驱动

1.nvidia 1.1显卡驱动 本机显卡型号:nvidia rtx 3090 1.1.1下载驱动 打开 https://www.nvidia.cn/geforce/drivers/ 也可以直接使用下面这个地址下载 https://www.nvidia.com/download/driverResults.aspx/205464/en-us/ 1.1.3安装驱动 右击,

Banana Pi BPI-F3 进迭时空RISC-V架构下,AI融合算力及其软件栈实践

RISC-V架构下,AI融合算力及其软件栈实践 面对未来大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空在RISC-V方向全面布局,通过精心设计的RISC-V DSA架构以及软硬一体的优化策略,将全力为未来打造高效且易用的AI算力解决方案。目前,进迭时空已经取得了显著的进展,成功推出了第一个版本的智算核(带AI融合算力的智算CPU)以及配套的AI软件栈。 软件栈简介 AI算法部署旨

黑神话:悟空》增加草地绘制距离MOD使游戏场景看起来更加广阔与自然,增强了游戏的沉浸式体验

《黑神话:悟空》增加草地绘制距离MOD为玩家提供了一种全新的视觉体验,通过扩展游戏中草地的绘制距离,增加了场景的深度和真实感。该MOD通过增加草地的绘制距离,使游戏场景看起来更加广阔与自然,增强了游戏的沉浸式体验。 增加草地绘制距离MOD安装 1、在%userprofile%AppDataLocalb1SavedConfigWindows目录下找到Engine.ini文件。 2、使用记事本编辑

黑神话悟空背后的技术揭秘与代码探秘

《重塑神话:黑神话悟空背后的技术揭秘与代码探秘》 引言 在国产游戏领域,《黑神话:悟空》无疑是一颗璀璨的明星,它不仅融合了深厚的中国文化元素,更在技术上实现了诸多突破,为玩家带来了前所未有的沉浸式体验。本文将深入剖析《黑神话:悟空》背后的关键技术,并通过代码案例展示其技术实现的魅力。 一、高精度动作捕捉技术 《黑神话:悟空》中的角色动作之所以如此逼真,得益于高精度动作捕捉技术的应用