大模型部署手记（4）MOSS+Jetson AGX Orin

2023-10-07 08:01

文章标签 部署模型 jetson moss agx orin 手记

本文主要是介绍大模型部署手记（4）MOSS+Jetson AGX Orin，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1.简介

组织机构：复旦大学

代码仓：GitHub - OpenLMLab/MOSS: An open-source tool-augmented conversational language model from Fudan University

模型：fnlp/moss-moon-003-sft-int4

下载：https://huggingface.co/fnlp/moss-moon-003-sft-int4

硬件环境：Jetson AGX Orin

根据：

所以显然只能选择int4量化了。

2.代码和模型下载

登录Orin：

cd /home1/zhanghui

git clone https://github.com/OpenLMLab/MOSS.git

量化int4的模型地址：https://huggingface.co/fnlp/moss-moon-003-sft-int4

打开链接下载：

下载完毕后，将其移动到 /home1/zhanghui/MOSS/fnlp/moss-moon-003-sft-int4 目录下：

3.安装依赖

conda create --name moss python=3.8

conda activate moss

cd MOSS

修改requirements.txt：

cd ..

pip install ./torch-1.13.0a0+d0d6b1f2.nv22.10-cp38-cp38-linux_aarch64.whl

cd MOSS

pip install -r requirements.txt

没装成功，注释掉 triton，再来：

源码安装triton

cd /home1/zhanghui

git clone https://github.com/openai/triton

cd triton

pip install ninja cmake wheel

pip install -e python

4.部署验证

运行命令行DEMO：

cd /home1/zhanghui

cd MOSS

python moss_cli_demo.py

程序死机了。（桌面不能动了，但是终端还可以操作）

系统不间断弹出以下画面：

pip install jittor

参考：https://zhuanlan.zhihu.com/p/610563590

pip install cupy-cuda11x -f http://pip.cupy.dev/aarch64

python moss_cli_demo.py --model_name fnlp/moss-moon-003-sft-int4 --gpu GPU

好像MOSS回答问题不像《流浪地球2》那么快，但是GPU却烧得厉害：

第二个问题等了几分钟都没动静。

MOSS，你到底能做什么呢？

等了好久，它终于回答了：

然而，后面一个问题，它又在耐心思考了。。。

MOSS，你是他吗？

又等了好久。。。

再来：

又等了好久：

所以MOSS它还是有能力的，只是现在有可能只是550W。

（全文完，谢谢阅读）

这篇关于大模型部署手记（4）MOSS+Jetson AGX Orin的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/157105。 23002807@qq.com

相关文章

Spring Boot项目部署命令java -jar的各种参数及作用详解

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》：本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

阅读更多...

Spring Security基于数据库的ABAC属性权限模型实战开发教程

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》：本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

阅读更多...

Java的IO模型、Netty原理解析

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容：标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO（blocking I/O）NI

阅读更多...

tomcat多实例部署的项目实践

tomcat多实例部署的项目实践

《tomcat多实例部署的项目实践》Tomcat多实例是指在一台设备上运行多个Tomcat服务,这些Tomcat相互独立,本文主要介绍了tomcat多实例部署的项目实践,具有一定的参考价值,感兴趣的可... 目录1.创建项目目录，测试文China编程件2js.创建实例的安装目录3.准备实例的配置文件4.编辑实例的

阅读更多...

SpringBoot配置Ollama实现本地部署DeepSeek

SpringBoot配置Ollama实现本地部署DeepSeek

《SpringBoot配置Ollama实现本地部署DeepSeek》本文主要介绍了在本地环境中使用Ollama配置DeepSeek模型,并在IntelliJIDEA中创建一个Sprin... 目录前言详细步骤一、本地配置DeepSeek二、SpringBoot项目调用本地DeepSeek前言随着人工智能技

阅读更多...

基于Flask框架添加多个AI模型的API并进行交互

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》：本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

阅读更多...

通过Docker Compose部署MySQL的详细教程

通过Docker Compose部署MySQL的详细教程

《通过DockerCompose部署MySQL的详细教程》DockerCompose作为Docker官方的容器编排工具,为MySQL数据库部署带来了显著优势,下面小编就来为大家详细介绍一... 目录一、docker Compose 部署 mysql 的优势二、环境准备与基础配置2.1 项目目录结构2.2 基

阅读更多...

CentOS 7部署主域名服务器 DNS的方法

CentOS 7部署主域名服务器 DNS的方法

《CentOS7部署主域名服务器DNS的方法》文章详细介绍了在CentOS7上部署主域名服务器DNS的步骤,包括安装BIND服务、配置DNS服务、添加域名区域、创建区域文件、配置反向解析、检查配置... 目录1. 安装 BIND 服务和工具2. 配置 BIND 服务3 . 添加你的域名区域配置4.创建区域

阅读更多...

OpenManus本地部署实战亲测有效完全免费(最新推荐)

OpenManus本地部署实战亲测有效完全免费(最新推荐)

《OpenManus本地部署实战亲测有效完全免费(最新推荐)》文章介绍了如何在本地部署OpenManus大语言模型,包括环境搭建、LLM编程接口配置和测试步骤,本文给大家讲解的非常详细,感兴趣的朋友一... 目录1.概况2.环境搭建2.1安装miniconda或者anaconda2.2 LLM编程接口配置2

阅读更多...

大数据spark3.5安装部署之local模式详解

大数据spark3.5安装部署之local模式详解

《大数据spark3.5安装部署之local模式详解》本文介绍了如何在本地模式下安装和配置Spark,并展示了如何使用SparkShell进行基本的数据处理操作,同时,还介绍了如何通过Spark-su... 目录下载上传解压配置jdk解压配置环境变量启动查看交互操作命令行提交应用spark，一个数据处理框架

阅读更多...