本地部署openvino-chaglm3-6b

本文主要是介绍本地部署openvino-chaglm3-6b，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

chatglm3.openvino Demo: https://github.com/OpenVINO-dev-contest/chatglm3.openvino/tree/main

想将github下的代码拉取到本地文件夹中，再打开Windows PowerShell，执行以下命令激活环境。

python -m venv openvino_env.\openvino_env\Scripts\activate

激活环境的时候，可能会报如下错误，这时候我们只需要输入以下命令，然后输入Y即可解决：

Set-ExecutionPolicy -Scope CurrentUser RemoteSigned

在这里插入图片描述
接下来我们使用以下命令更新pip以及安装所需要的一些依赖库。

python -m pip install --upgrade pippip install wheel setuptoolspip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

python convert.py --model_id THUDM/chatglm3-6b --output {your_path}/chatglm3-6b

–model_id - 用于从 Huggngface_hub (https://huggingface.co/models) 或模型所在目录的路径（绝对路径）。
–output - 转换后模型保存的地址

如果访问huggingface 有困难，可以尝试使用 mirror-hf 进行下载.

# LINUX
export HF_ENDPOINT=https://hf-mirror.com
# Windows Powershell
$env:HF_ENDPOINT = "https://hf-mirror.com"

Download model

huggingface-cli download --resume-download --local-dir-use-symlinks False THUDM/chatglm3-6b --local-dir {your_path}/chatglm3-6b

在这里插入图片描述

python quantize.py --model_path {your_path}/chatglm3-6b --precision int4 --output {your_path}/chatglm3-6b-int4

python chat.py --model_path {your_path}/chatglm3-6b --max_sequence_length 4096 --device CPU

在这里插入图片描述

这篇关于本地部署openvino-chaglm3-6b的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！