1文件+2个命令,无需安装,单机离线运行70亿大模型

2023-12-09 03:52

本文主要是介绍1文件+2个命令,无需安装,单机离线运行70亿大模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1文件+2个命令,无需安装,单机离线运行70亿大模型

大家好,我是老章

最近苹果发布了自己的深度学习框架--MLX,专门为自家M系列芯片优化。看了展示视频,这个框架还能直接运行Llama 7B的大模型,在M2 Ultral上运行流畅。但是我尝试了一下,我的M2 Mac mini根本跑不动,模型权重太大了。

这倒勾起了我继续单机玩大模型的兴趣,然后就发现了llamafile的玩法:下载模型文件、直接执行即可浏览器中运行,就可以开始聊天,还可以上传图片进行提问。

先不介绍原理,直接看看如何运行吧:

1、下载llava-v1.5-7b-q4-server.llama 文件(对应模型是[LLaVA 1.5](https://llava-vl.github.io/),在 Llama 2 之上进行微调的大型多模式模型 )

![](https://my-wechat.oss-cn-beijing.aliyuncs.com/image-20231208145027864.png)

下载地址:https://huggingface.co/jartine/llava-v1.5-7B-GGUF/resolve/main/llava-v1.5-7b-q4-server.llamafile?download=true

鉴于有些同学可能无法访问huggingface,我也准备了这个文件在网盘,有需要可以找我要一下。

2、MacOS和linux用户需要在命令行中先授权这个文件可执行

```
chmod +x llava-v1.5-7b-q4-server.llamafile
# 然后运行
./llava-v1.5-7b-q4-server.llamafile
```

![](https://my-wechat.oss-cn-beijing.aliyuncs.com/Xnapper-2023-12-08-14.17.26.png)

如果是windows用户,那就更省事了,直接重命名这个文件,后面加上 .exe 即可

3、浏览器会自动弹开聊天界面(如果没有,浏览器中直接打开[https://localhost:8080](https://localhost:8080/)即可)

![](https://my-wechat.oss-cn-beijing.aliyuncs.com/Xnapper-2023-12-08-14.18.50.png)

首次打开需要配置一些参数,也可以直接使用默认值。

除了聊天,也可以上传图片让它识别。聊天完毕后,返回终端并点击 Control-C关闭 llamafile。

![](https://my-wechat.oss-cn-beijing.aliyuncs.com/llamafile-20231208154051192.jpg)

顺便简单介绍一下llamafile:

这个大模型文件是Mozilla 团队发布的,这个文件包含 LLM 的模型权重和运行该模型所需的代码 ,可以将它视为一个完整的本地服务器,带有用于与其交互的 Web UI。

llamafile是基于[llama.cpp](https://github.com/ggerganov/llama.cpp)(一个领先的开源 LLM 聊天机器人框架)和[Cosmopolitan Libc](https://github.com/jart/cosmopolitan)(一个开源项目,使 C 程序能够在大量平台和架构上编译和运行)实现的。使用 llamafile,可以将大型语言模型 (LLM) 权重文件转换为可在六种操作系统(macOS、Windows、Linux、FreeBSD、OpenBSD 和 NetBSD)上运行的二进制文件,而无需安装,确保给定的一组权重将永远保持可用并一致且可重复地执行。

想要了解更多,可以参考一下资料:

模型演示:https://llava.hliu.cc/

模型简介:https://llava-vl.github.io/

模型代码:https://github.com/haotian-liu/LLaVA

llamafile开源地址:https://github.com/Mozilla-Ocho/llamafile

llamafile简介:https://hacks.mozilla.org/2023/11/introducing-llamafile/

这篇关于1文件+2个命令,无需安装,单机离线运行70亿大模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/472379

相关文章

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

MySQL Workbench 安装教程(保姆级)

《MySQLWorkbench安装教程(保姆级)》MySQLWorkbench是一款强大的数据库设计和管理工具,本文主要介绍了MySQLWorkbench安装教程,文中通过图文介绍的非常详细,对大... 目录前言:详细步骤:一、检查安装的数据库版本二、在官网下载对应的mysql Workbench版本,要是

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Linux安装MySQL的教程

《Linux安装MySQL的教程》:本文主要介绍Linux安装MySQL的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux安装mysql1.Mysql官网2.我的存放路径3.解压mysql文件到当前目录4.重命名一下5.创建mysql用户组和用户并修

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py

Java终止正在运行的线程的三种方法

《Java终止正在运行的线程的三种方法》停止一个线程意味着在任务处理完任务之前停掉正在做的操作,也就是放弃当前的操作,停止一个线程可以用Thread.stop()方法,但最好不要用它,本文给大家介绍了... 目录前言1. 停止不了的线程2. 判断线程是否停止状态3. 能停止的线程–异常法4. 在沉睡中停止5

Android App安装列表获取方法(实践方案)

《AndroidApp安装列表获取方法(实践方案)》文章介绍了Android11及以上版本获取应用列表的方案调整,包括权限配置、白名单配置和action配置三种方式,并提供了相应的Java和Kotl... 目录前言实现方案         方案概述一、 androidManifest 三种配置方式

Python解析器安装指南分享(Mac/Windows/Linux)

《Python解析器安装指南分享(Mac/Windows/Linux)》:本文主要介绍Python解析器安装指南(Mac/Windows/Linux),具有很好的参考价值,希望对大家有所帮助,如有... 目NMNkN录1js. 安装包下载1.1 python 下载官网2.核心安装方式3. MACOS 系统安