liunx服务器部署Llama2大模型

本文主要是介绍liunx服务器部署Llama2大模型，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

模型：Llama2-chat-13B-Chinese-50W
在这里插入图片描述

01 下载安装 Llama2 模型

Huggingface在国内是访问不了的，需要使用代理。在这里推荐使用 clash-for-liunx 配置代理。

安装 git-lfs，用于大文件下载

sudo apt-get install git-lfs
git lfs install

Huggingface 下载 Llama2 模型

git clone https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W

这里会下载很久，耐心等待吧。另外，可能会有文件下载失败，需要自己手动下载：

wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00001-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00002-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00003-of-00003.bin

环境配置

安装依赖库：

python -m pip install torch==2.0.0
python -m pip install transformers==4.30.0
python -m pip install sentencepiece==0.1.97python -m pip install peft==0.10.0
python -m pip install gradio==3.50.0
python -m pip install bitsandbytes
python -m pip install accelerate
python -m pip install scipy

同时将把 gradio 里的gradio_demo.py下载到服务器

wget https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/inference/gradio_demo.py
mv gradio_demo.py ~/Workspace/Llama2/

部署

查看GPU状态

nvidia-smi

命令行启动

python gradio_demo.py --base_model Llama2-chat-13B-Chinese-50W --tokenizer_path Llama2-chat-13B-Chinese-50W --load_in_8bit --gpus 0

效果展示

在这里插入图片描述

这篇关于liunx服务器部署Llama2大模型的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

liunx服务器部署Llama2大模型

01 下载安装 Llama2 模型

环境配置

部署

效果展示

相关文章

使用Python实现快速搭建本地HTTP服务器

Java的IO模型、Netty原理解析

tomcat多实例部署的项目实践

SpringBoot配置Ollama实现本地部署DeepSeek

基于Flask框架添加多个AI模型的API并进行交互

通过Docker Compose部署MySQL的详细教程

CentOS 7部署主域名服务器 DNS的方法

Windows Server服务器上配置FileZilla后，FTP连接不上？

OpenManus本地部署实战亲测有效完全免费(最新推荐)

大数据spark3.5安装部署之local模式详解