DCU服务器基于Docker开发

2023-11-06 08:50
文章标签 服务器 开发 docker dcu

本文主要是介绍DCU服务器基于Docker开发,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DCU服务器使用说明

基本信息

海光CPU

cat /proc/cpuinfoprocessor	: 127
vendor_id	: HygonGenuine
cpu family	: 24
model		: 2
model name	: Hygon C86 7381 32-core Processor
stepping	: 2
microcode	: 0x80901047
cpu MHz		: 2490.922
cache size	: 512 KB
physical id	: 1
siblings	: 64
core id		: 31
cpu cores	: 32

曙光DCU

rocm相关命令

rocm-smi相当于nvidia-smi

[root@dcu0 /]# roc
rocfft_rtc_helper      rocm_agent_enumerator  rocm-bandwidth-test    rocminfo               rocm-smi               rocm_smi.py            rocm-smi.sh[root@dcu0 /]# rocm-smi==========================System Management Interface ==========================
================================================================================
DCU  Temp   AvgPwr  Fan   Perf  PwrCap  VRAM%  DCU%  
0    30.0c  39.0W   0.0%  auto  280.0W    0%   0%    
1    30.0c  41.0W   0.0%  auto  280.0W    0%   0%    
2    30.0c  38.0W   0.0%  auto  280.0W    0%   0%    
3    31.0c  39.0W   0.0%  auto  280.0W    0%   0%    
4    31.0c  41.0W   0.0%  auto  280.0W    0%   0%    
5    29.0c  38.0W   0.0%  auto  280.0W    0%   0%    
6    30.0c  39.0W   0.0%  auto  280.0W    0%   0%    
7    29.0c  38.0W   0.0%  auto  280.0W    0%   0%    
================================================================================
=================================End of SMI Log=================================

操作系统

银河麒麟 V10SP3

[root@dcu0 /]# cat /proc/version 
Linux version 4.19.90-52.26.v2207.ky10.x86_64 (KYLINSOFT@localhost.localdomain) (gcc version 7.3.0 (GCC)) #1 SMP Mon Jul 3 16:52:50 CST 2023

应用软件

Docker

Docker数据目录 /apps/docker

Docker内网源已配置

Python

系统自带Python3.7.9,不使用,自构建镜像

内网Pypi源配置

  • widows C:/用户目录/pip/pip.ini

  • linux ~/.pip/pip.conf

[global]
index-url=http://10.160.8.81:8081/repository/pypi-group/simple
trusted-host=10.160.8.81

在服务器上使用DCU显卡

支持调用显卡的Python库

  • Pytorch1.1
  • PaddlePaddle2.5.0
docker image list | grep -E 'paddle|pytorch'
image.sourcefind.cn:5000/dcu/admin/base/paddlepaddle   2.5.0-ubuntu20.04-dtk-23.04-py38-latest    215c1adc490a        18 hours ago        11.9GB
image.sourcefind.cn:5000/dcu/admin/base/paddlepaddle   2.4.2-ubuntu20.04-dtk-23.04-py38-latest    b9a73c180d74        2 months ago        10.4GB
image.sourcefind.cn:5000/dcu/admin/base/pytorch        1.10.0-ubuntu20.04-dtk-23.04-py38-latest   124ff31e5a8d        2 months ago        11.2GB

2.4.2-ubuntu20.04-dtk-23.04-py38-latest有BUG

使用到pytorch和paddlepaddle则需要在厂家提供的基础镜像上构建自己的镜像

本地远程连接服务器开发

本地新建项目

配置python解释器,仅用于pycharm代码提示补全

在这里插入图片描述

配置远程连接

  • Tools, Deployment, Configuration

在这里插入图片描述

SSH和SFTP连接

在这里插入图片描述

配置本地工作目录映射的服务器目录

选择Mappings,配置本地工作目录映射的服务器目录

服务器工作目录在/soft,建议在此目录下以自己姓名新建文件夹
在这里插入图片描述

设置服务器忽略目录

工作目录下的python虚拟环境venv不会被上传到服务器

在这里插入图片描述

配置自动上传

点击项目根目录,点击Tools Deployment Automatic Upload

手动点击一次Upload to,上传到服务器,检查是否上传成功

每次本地目录发生变化,会自动同步到服务器

在这里插入图片描述

编写Dockerfile

以运行chatgml2为例,构建需要的镜像

FROM image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.10.0-ubuntu20.04-dtk-23.04-py38-latest
LABEL authors="HuangChunFeng"# 工作目录
WORKDIR /root# 镜像内配置pypi源
RUN mkdir -p /root/.pip && \echo '[global]\nindex-url=http://10.160.8.81:8081/repository/pypi-group/simple\ntrusted-host=10.160.8.81' > /root/.pip/pip.conf# 安装python库,容器已自带pytorch1.10.0
RUN pip3 install fastapi uvicorn transformers sentencepiece

构建镜像

点击Tools Start SSH Session,ssh到服务器,cd到对应目录,构建镜像

Last login: Tue Aug 29 09:46:49 2023 from 10.160.73.71
[root@dcu0 ~]# cd /soft/huangchunfeng/projects/chatglm2-demo/
[root@dcu0 chatglm2-demo]# docker build -f ./Dockerfile -t hcf/chatglm2-demo .

在这里插入图片描述

本地安装和镜像中相同的依赖

仅用于pycharm代码提示,包版本尽量与容器中一致

在这里插入图片描述

编写代码

main.py

"""
@author: hcf
@time: 2023/8/29 10:14 
"""
from fastapi import FastAPI, Body
from pydantic import BaseModel
from typing_extensions import Annotated
from transformers import AutoTokenizer, AutoModel# docker run 指定的模型文件挂载路径
model_path = '/chatglm2-6b'
# 加载模型
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModel.from_pretrained(model_path, trust_remote_code=True, device='cuda')
model = model.eval()# web api
app = FastAPI()class ChatCompletionPayload(BaseModel):question: strstream: bool = Falseclass ChatCompletionView(BaseModel):response: str@app.post('/v1/chat/completion')
async def chat(payload: Annotated[ChatCompletionPayload, Body()]):response, _ = model.chat(tokenizer, payload.question)return ChatCompletionView(response=response)

编写启动脚本

#!/bin/bashcur_dir=$(cd "$(dirname $0)"; pwd)
# 测试时使用-it --rm参数
docker run -it --rm --name dcu-chatglm2-demo \
`# 容器网络配置` \
--ipc=host --network host \
`# 容器内使用DCU必备参数,需要使用DCU复制即可` \
--device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined --cap-add=SYS_PTRACE --shm-size=16G --group-add 39 \
`# 挂载工作目录` \
-v $cur_dir:/root \
`# 挂在模型文件` \
-v /soft/chatglm2-6b-boot/THUDM/chatglm2-6b:/chatglm2-6b \
hcf/chatglm2-demo \
`# 启动命令,需要激活env.sh环境变量` \
bash -c "source /opt/dtk/cuda/env.sh && uvicorn main:app --host 0.0.0.0 --port 8000"

启动容器

此时服务器对应目录下有3个文件

在这里插入图片描述

# 可执行权限
[root@dcu0 chatglm2-demo]# chmod +x ./startup.sh
[root@dcu0 chatglm2-demo]# ./startup.sh ______  ____________  ____  ________  __/ __ \ \/ /_  __/ __ \/ __ \/ ____/ / / // /_/ /\  / / / / / / / /_/ / /   / /_/ / / ____/ / / / / / /_/ / _, _/ /___/ __  /  
/_/     /_/ /_/  \____/_/ |_|\____/_/ /_/   DTK version 23.04
pytorch version 1.10.0
8 DCU were detected in the container.
NOTE: Make sure the user is in the video group.
For more information, please go to https://developer.hpccube.com/
Loading checkpoint shards: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:07<00:00,  1.02s/it]
INFO:     Started server process [1]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

测试接口

可使用Postman,ApiPost等其他工具

直接在pycharm中New HTTP Request

在这里插入图片描述

测试结果

可使用Postman,ApiPost等其他工具

直接在pycharm中New HTTP Request

在这里插入图片描述

这篇关于DCU服务器基于Docker开发的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/355628

相关文章

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

mysql中的服务器架构详解

《mysql中的服务器架构详解》:本文主要介绍mysql中的服务器架构,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、mysql服务器架构解释3、总结1、背景简单理解一下mysqphpl的服务器架构。2、mysjsql服务器架构解释mysql的架

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信

Python中对FFmpeg封装开发库FFmpy详解

《Python中对FFmpeg封装开发库FFmpy详解》:本文主要介绍Python中对FFmpeg封装开发库FFmpy,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、FFmpy简介与安装1.1 FFmpy概述1.2 安装方法二、FFmpy核心类与方法2.1 FF

基于Python开发Windows屏幕控制工具

《基于Python开发Windows屏幕控制工具》在数字化办公时代,屏幕管理已成为提升工作效率和保护眼睛健康的重要环节,本文将分享一个基于Python和PySide6开发的Windows屏幕控制工具,... 目录概述功能亮点界面展示实现步骤详解1. 环境准备2. 亮度控制模块3. 息屏功能实现4. 息屏时间

MySQL MCP 服务器安装配置最佳实践

《MySQLMCP服务器安装配置最佳实践》本文介绍MySQLMCP服务器的安装配置方法,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录mysql MCP 服务器安装配置指南简介功能特点安装方法数据库配置使用MCP Inspector进行调试开发指

在Windows上使用qemu安装ubuntu24.04服务器的详细指南

《在Windows上使用qemu安装ubuntu24.04服务器的详细指南》本文介绍了在Windows上使用QEMU安装Ubuntu24.04的全流程:安装QEMU、准备ISO镜像、创建虚拟磁盘、配置... 目录1. 安装QEMU环境2. 准备Ubuntu 24.04镜像3. 启动QEMU安装Ubuntu4

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

使用Python开发一个现代化屏幕取色器

《使用Python开发一个现代化屏幕取色器》在UI设计、网页开发等场景中,颜色拾取是高频需求,:本文主要介绍如何使用Python开发一个现代化屏幕取色器,有需要的小伙伴可以参考一下... 目录一、项目概述二、核心功能解析2.1 实时颜色追踪2.2 智能颜色显示三、效果展示四、实现步骤详解4.1 环境配置4.