首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
vgpu专题
Ascend显卡创建虚拟vgpu实例
当你使用 npu-smi 工具来创建虚拟 NPU(Virtual NPU,简称 vNPU)时,你可以指定虚拟 NPU 的显存大小。然而,npu-smi 命令的具体参数可能会有所不同,取决于你使用的 NPU 硬件和驱动程序版本。 根据你的需求,你希望创建一个具有 2GB 显存的虚拟 NPU。以下是详细的步骤和命令示例: 1. 确认 NPU 驱动支持虚拟化 首先,确保你的 NPU 驱动支持虚拟化
阅读更多...
怎样节省 2/3 的 GPU?爱奇艺 vGPU 的探索与实践
随着人工智能技术的发展,爱奇艺内部越来越多的服务使用深度学习模型和技术来驱动,为我们的用户提供更加智能和便捷的在线视频观看体验。其中在线类的服务,通常单个容器实例需要独占一个 GPU,以实现在毫秒/秒级延时内完成例如视频、图片、语音、文本的深度学习模型推理请求;为了保证响应延时,请求通常单独进行,无法对请求做batch以提升计算效率,且不同请求间隔随机,会导致这些服务的 GPU 计算资源的利用率
阅读更多...
K8S节点GPU虚拟化(vGPU)
vGPU实现方案 4paradigm提供了k8s-device-plugin,该插件基于NVIDIA官方插件(NVIDIA/k8s-device-plugin),在保留官方功能的基础上,实现了对物理GPU进行切分,并对显存和计算单元进行限制,从而模拟出多张小的vGPU卡。在k8s集群中,基于这些切分后的vGPU进行调度,使不同的容器可以安全的共享同一张物理GPU,提高GPU的利用率。此外,插件还可
阅读更多...