DCU服务器基于Docker开发

2023-11-06 08:50
文章标签 服务器 开发 docker dcu

本文主要是介绍DCU服务器基于Docker开发,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DCU服务器使用说明

基本信息

海光CPU

cat /proc/cpuinfoprocessor	: 127
vendor_id	: HygonGenuine
cpu family	: 24
model		: 2
model name	: Hygon C86 7381 32-core Processor
stepping	: 2
microcode	: 0x80901047
cpu MHz		: 2490.922
cache size	: 512 KB
physical id	: 1
siblings	: 64
core id		: 31
cpu cores	: 32

曙光DCU

rocm相关命令

rocm-smi相当于nvidia-smi

[root@dcu0 /]# roc
rocfft_rtc_helper      rocm_agent_enumerator  rocm-bandwidth-test    rocminfo               rocm-smi               rocm_smi.py            rocm-smi.sh[root@dcu0 /]# rocm-smi==========================System Management Interface ==========================
================================================================================
DCU  Temp   AvgPwr  Fan   Perf  PwrCap  VRAM%  DCU%  
0    30.0c  39.0W   0.0%  auto  280.0W    0%   0%    
1    30.0c  41.0W   0.0%  auto  280.0W    0%   0%    
2    30.0c  38.0W   0.0%  auto  280.0W    0%   0%    
3    31.0c  39.0W   0.0%  auto  280.0W    0%   0%    
4    31.0c  41.0W   0.0%  auto  280.0W    0%   0%    
5    29.0c  38.0W   0.0%  auto  280.0W    0%   0%    
6    30.0c  39.0W   0.0%  auto  280.0W    0%   0%    
7    29.0c  38.0W   0.0%  auto  280.0W    0%   0%    
================================================================================
=================================End of SMI Log=================================

操作系统

银河麒麟 V10SP3

[root@dcu0 /]# cat /proc/version 
Linux version 4.19.90-52.26.v2207.ky10.x86_64 (KYLINSOFT@localhost.localdomain) (gcc version 7.3.0 (GCC)) #1 SMP Mon Jul 3 16:52:50 CST 2023

应用软件

Docker

Docker数据目录 /apps/docker

Docker内网源已配置

Python

系统自带Python3.7.9,不使用,自构建镜像

内网Pypi源配置

  • widows C:/用户目录/pip/pip.ini

  • linux ~/.pip/pip.conf

[global]
index-url=http://10.160.8.81:8081/repository/pypi-group/simple
trusted-host=10.160.8.81

在服务器上使用DCU显卡

支持调用显卡的Python库

  • Pytorch1.1
  • PaddlePaddle2.5.0
docker image list | grep -E 'paddle|pytorch'
image.sourcefind.cn:5000/dcu/admin/base/paddlepaddle   2.5.0-ubuntu20.04-dtk-23.04-py38-latest    215c1adc490a        18 hours ago        11.9GB
image.sourcefind.cn:5000/dcu/admin/base/paddlepaddle   2.4.2-ubuntu20.04-dtk-23.04-py38-latest    b9a73c180d74        2 months ago        10.4GB
image.sourcefind.cn:5000/dcu/admin/base/pytorch        1.10.0-ubuntu20.04-dtk-23.04-py38-latest   124ff31e5a8d        2 months ago        11.2GB

2.4.2-ubuntu20.04-dtk-23.04-py38-latest有BUG

使用到pytorch和paddlepaddle则需要在厂家提供的基础镜像上构建自己的镜像

本地远程连接服务器开发

本地新建项目

配置python解释器,仅用于pycharm代码提示补全

在这里插入图片描述

配置远程连接

  • Tools, Deployment, Configuration

在这里插入图片描述

SSH和SFTP连接

在这里插入图片描述

配置本地工作目录映射的服务器目录

选择Mappings,配置本地工作目录映射的服务器目录

服务器工作目录在/soft,建议在此目录下以自己姓名新建文件夹
在这里插入图片描述

设置服务器忽略目录

工作目录下的python虚拟环境venv不会被上传到服务器

在这里插入图片描述

配置自动上传

点击项目根目录,点击Tools Deployment Automatic Upload

手动点击一次Upload to,上传到服务器,检查是否上传成功

每次本地目录发生变化,会自动同步到服务器

在这里插入图片描述

编写Dockerfile

以运行chatgml2为例,构建需要的镜像

FROM image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.10.0-ubuntu20.04-dtk-23.04-py38-latest
LABEL authors="HuangChunFeng"# 工作目录
WORKDIR /root# 镜像内配置pypi源
RUN mkdir -p /root/.pip && \echo '[global]\nindex-url=http://10.160.8.81:8081/repository/pypi-group/simple\ntrusted-host=10.160.8.81' > /root/.pip/pip.conf# 安装python库,容器已自带pytorch1.10.0
RUN pip3 install fastapi uvicorn transformers sentencepiece

构建镜像

点击Tools Start SSH Session,ssh到服务器,cd到对应目录,构建镜像

Last login: Tue Aug 29 09:46:49 2023 from 10.160.73.71
[root@dcu0 ~]# cd /soft/huangchunfeng/projects/chatglm2-demo/
[root@dcu0 chatglm2-demo]# docker build -f ./Dockerfile -t hcf/chatglm2-demo .

在这里插入图片描述

本地安装和镜像中相同的依赖

仅用于pycharm代码提示,包版本尽量与容器中一致

在这里插入图片描述

编写代码

main.py

"""
@author: hcf
@time: 2023/8/29 10:14 
"""
from fastapi import FastAPI, Body
from pydantic import BaseModel
from typing_extensions import Annotated
from transformers import AutoTokenizer, AutoModel# docker run 指定的模型文件挂载路径
model_path = '/chatglm2-6b'
# 加载模型
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModel.from_pretrained(model_path, trust_remote_code=True, device='cuda')
model = model.eval()# web api
app = FastAPI()class ChatCompletionPayload(BaseModel):question: strstream: bool = Falseclass ChatCompletionView(BaseModel):response: str@app.post('/v1/chat/completion')
async def chat(payload: Annotated[ChatCompletionPayload, Body()]):response, _ = model.chat(tokenizer, payload.question)return ChatCompletionView(response=response)

编写启动脚本

#!/bin/bashcur_dir=$(cd "$(dirname $0)"; pwd)
# 测试时使用-it --rm参数
docker run -it --rm --name dcu-chatglm2-demo \
`# 容器网络配置` \
--ipc=host --network host \
`# 容器内使用DCU必备参数,需要使用DCU复制即可` \
--device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined --cap-add=SYS_PTRACE --shm-size=16G --group-add 39 \
`# 挂载工作目录` \
-v $cur_dir:/root \
`# 挂在模型文件` \
-v /soft/chatglm2-6b-boot/THUDM/chatglm2-6b:/chatglm2-6b \
hcf/chatglm2-demo \
`# 启动命令,需要激活env.sh环境变量` \
bash -c "source /opt/dtk/cuda/env.sh && uvicorn main:app --host 0.0.0.0 --port 8000"

启动容器

此时服务器对应目录下有3个文件

在这里插入图片描述

# 可执行权限
[root@dcu0 chatglm2-demo]# chmod +x ./startup.sh
[root@dcu0 chatglm2-demo]# ./startup.sh ______  ____________  ____  ________  __/ __ \ \/ /_  __/ __ \/ __ \/ ____/ / / // /_/ /\  / / / / / / / /_/ / /   / /_/ / / ____/ / / / / / /_/ / _, _/ /___/ __  /  
/_/     /_/ /_/  \____/_/ |_|\____/_/ /_/   DTK version 23.04
pytorch version 1.10.0
8 DCU were detected in the container.
NOTE: Make sure the user is in the video group.
For more information, please go to https://developer.hpccube.com/
Loading checkpoint shards: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:07<00:00,  1.02s/it]
INFO:     Started server process [1]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

测试接口

可使用Postman,ApiPost等其他工具

直接在pycharm中New HTTP Request

在这里插入图片描述

测试结果

可使用Postman,ApiPost等其他工具

直接在pycharm中New HTTP Request

在这里插入图片描述

这篇关于DCU服务器基于Docker开发的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/355628

相关文章

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Linux搭建ftp服务器的步骤

《Linux搭建ftp服务器的步骤》本文给大家分享Linux搭建ftp服务器的步骤,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录ftp搭建1:下载vsftpd工具2:下载客户端工具3:进入配置文件目录vsftpd.conf配置文件4:

基于Java开发一个极简版敏感词检测工具

《基于Java开发一个极简版敏感词检测工具》这篇文章主要为大家详细介绍了如何基于Java开发一个极简版敏感词检测工具,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录你是否还在为敏感词检测头疼一、极简版Java敏感词检测工具的3大核心优势1.1 优势1:DFA算法驱动,效率提升10

Linux查询服务器 IP 地址的命令详解

《Linux查询服务器IP地址的命令详解》在服务器管理和网络运维中,快速准确地获取服务器的IP地址是一项基本但至关重要的技能,下面我们来看看Linux中查询服务器IP的相关命令使用吧... 目录一、hostname 命令:简单高效的 IP 查询工具命令详解实际应用技巧注意事项二、ip 命令:新一代网络配置全

Python开发简易网络服务器的示例详解(新手入门)

《Python开发简易网络服务器的示例详解(新手入门)》网络服务器是互联网基础设施的核心组件,它本质上是一个持续运行的程序,负责监听特定端口,本文将使用Python开发一个简单的网络服务器,感兴趣的小... 目录网络服务器基础概念python内置服务器模块1. HTTP服务器模块2. Socket服务器模块

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言:系统版本查询的重要性二、基础命令解析:cat /etc/Centos-release详

Python WSGI HTTP服务器Gunicorn使用详解

《PythonWSGIHTTP服务器Gunicorn使用详解》Gunicorn是Python的WSGI服务器,用于部署Flask/Django应用,性能高且稳定,支持多Worker类型与配置,可处... 目录一、什么是 Gunicorn?二、为什么需要Gunicorn?三、安装Gunicorn四、基本使用启