Ollama教程,本地部署大模型Ollama,docker安装方法,仅供学习使用

本文主要是介绍Ollama教程,本地部署大模型Ollama,docker安装方法,仅供学习使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

不可商用!!仅仅提供学习使用!

先上视频教学:

Ollama教程,本地部署大模型Ollama,docker安装方法,仅供学习使用!



资料获取   :

Ollama下载包和安装文档在这里:  阿里云地址

[打call]

[打call]

[星星眼]


https://www.alipan.com/s/ft9WkSX5zbH
点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。​​​​​​​

简易教学

Ollama教程:本地部署大模型Ollama

一、Ollama简介

Ollama是一个开源的大型语言模型服务工具,它帮助用户快速在本地运行大模型。用户可以通过简单的安装指令,在本地运行开源大型语言模型,如Llama 2等。

二、本地部署Ollama

  1. 下载Ollama
    • 访问Ollama官网(https://ollama.ai/download),根据你使用的系统下载相应版本。
    • 截止到2024年2月16日,Ollama已经支持Windows系统。
  2. 安装Ollama
    • 在Linux系统中,可以通过执行以下命令进行安装:curl https://ollama.ai/install.sh | sh
    • 在Windows系统中,直接双击运行安装文件即可。
  3. 使用Ollama
    • 访问Ollama的模型库(https://ollama.ai/library),检索并运行你想使用的模型。例如,运行Llama 2的命令为:ollama run llama2
  4. 配置Ollama的模型路径
    • Ollama的模型默认会存储在用户文件夹下的.ollama/models文件夹中。你可以通过配置环境变量OLLAMA_MODELS来指定模型路径。
  5. 下载和运行模型
    • 以llama3模型为例,该模型有8B和70B两个版本,分别代表80亿和700亿个训练参数。你可以通过命令ollama run llama3来默认安装8B模型,或者使用ollama run llama3:8b来指定安装8B模型。

Docker安装Ollama方法

  1. 安装NVIDIA Container Toolkit(如果使用NVIDIA GPU)
    • 配置repository:curl -s -L <https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo> | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
    • 安装NVIDIA Container Toolkit包:sudo yum install -y nvidia-container-toolkit
  2. 配置Docker以使用NVIDIA驱动
    • 执行命令:sudo nvidia-ctk runtime configure --runtime=docker
    • 重启Docker服务:sudo systemctl restart docker
  3. 拉取和运行Ollama镜像
    • 使用CUDA运行:docker run -d --restart=always --gpus=all -v /mydata/docker/local/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
    • 使用AMD显卡运行:docker run -d --restart=always --device /dev/kfd --device /dev/dri -v /mydata/docker/local/ollama/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm
  4. 运行模型
    • 首次运行会拉取镜像,之后可以直接运行。例如,运行Llama3 7B的命令为:docker exec -it ollama ollama run llama3

以上是关于Ollama本地部署和Docker安装方法的详细教程。

补充

配置Ollama的模型路径

配置Ollama的模型路径通常涉及到设置环境变量,这样Ollama就能知道在哪里查找和加载模型文件。以下是一般步骤来配置Ollama的模型路径:

  1. 确定模型存储位置
    首先,你需要确定你的模型文件存放在哪个目录下。这个目录可以是本地文件系统上的任何位置。

  2. 设置环境变量
    在Unix/Linux系统中,你可以使用export命令来设置环境变量。在Windows系统中,你可以通过“系统属性”->“高级”->“环境变量”来设置。

    对于Unix/Linux系统,你可以打开你的shell配置文件(比如~/.bashrc~/.bash_profile),并添加以下行来设置环境变量:

     

    bash复制代码

    export OLLAMA_MODELS=/path/to/your/models

    替换/path/to/your/models为你的模型实际存放的目录路径。

    然后,你需要使这个更改生效。如果你已经打开了shell,你可以运行source ~/.bashrc(或你的配置文件名)来加载新的环境变量。否则,你可以关闭并重新打开你的shell。

    对于Windows系统,你需要:

    • 右键点击“此电脑”或“计算机”,选择“属性”。
    • 点击“高级系统设置”。
    • 在“高级”选项卡中,点击“环境变量”。
    • 在“系统变量”部分,点击“新建”来创建一个新的环境变量。
    • 输入变量名OLLAMA_MODELS和变量值(即你的模型路径)。
    • 点击“确定”保存更改。
  3. 重启Ollama
    如果你已经运行了Ollama服务,你可能需要重启它以使新的环境变量设置生效。这通常可以通过停止服务并重新启动来完成。

  4. 验证配置
    在Ollama中运行一个命令来加载或列出模型,以确保Ollama能够正确找到并加载模型文件。

注意,Ollama的确切配置方法可能会根据其版本和文档有所不同。因此,建议参考Ollama的官方文档或GitHub存储库中的README文件以获取最准确的信息。此外,如果Ollama提供了一个配置文件或命令行选项来设置模型路径,那么你也可以使用那些方法。

找不到环境变量在哪里?

当您提到找不到环境变量在哪里时,我理解您可能是在询问如何在不同的操作系统中查看或设置环境变量。以下是在不同操作系统中查看和设置环境变量的清晰步骤:

Windows系统

  1. 查看环境变量
    • 右键点击“此电脑”或“计算机”,选择“属性”。
    • 点击“高级系统设置”。
    • 在“高级”选项卡中,点击“环境变量”。
    • 在这里,您可以看到“用户变量”和“系统变量”两个部分。用户变量仅对当前用户有效,而系统变量对所有用户都有效。
  2. 设置环境变量
    • 在“用户变量”或“系统变量”部分,点击“新建”来创建一个新的环境变量。
    • 输入变量名(如MY_ENV_VAR)和变量值(如C:\path\to\your\directory)。
    • 点击“确定”保存更改。

Linux系统

  1. 查看环境变量
    • 打开终端。
    • 输入printenv命令查看所有环境变量。
    • 或者,使用echo $VARIABLE_NAME(将VARIABLE_NAME替换为您要查看的变量名)来查看特定环境变量的值。
  2. 设置环境变量(临时,仅在当前终端会话中有效):
    • 在终端中,使用export VARIABLE_NAME=value命令(将VARIABLE_NAME替换为您要设置的变量名,value替换为值)。
  3. 设置环境变量(永久):
    • 对于所有用户,编辑/etc/profile/etc/environment/etc/bash.bashrc文件(取决于您的系统和需求)。
    • 对于当前用户,编辑~/.bashrc~/.bash_profile~/.profile~/.zshrc文件(取决于您使用的shell)。
    • 在文件的末尾添加export VARIABLE_NAME=value
    • 保存文件后,重新加载配置文件(如source ~/.bashrc)或重新登录以使更改生效。

Mac系统

  1. 查看环境变量
    • 打开终端。
    • 输入printenv命令查看所有环境变量。
    • 或者,使用echo $VARIABLE_NAME(将VARIABLE_NAME替换为您要查看的变量名)来查看特定环境变量的值。
  2. 设置环境变量(临时,仅在当前终端会话中有效):
    • 在终端中,使用export VARIABLE_NAME=value命令(将VARIABLE_NAME替换为您要设置的变量名,value替换为值)。
  3. 设置环境变量(永久):
    • 对于所有用户,编辑/etc/profile/etc/launchd.conf文件(但请注意,/etc/launchd.conf在较新版本的macOS中可能不再使用)。
    • 对于当前用户,编辑~/.bash_profile~/.zshrc~/.profile文件(取决于您使用的shell)。
    • 在文件的末尾添加export VARIABLE_NAME=value
    • 保存文件后,重新加载配置文件(如source ~/.bash_profilesource ~/.zshrc)或重新登录以使更改生效。

这篇关于Ollama教程,本地部署大模型Ollama,docker安装方法,仅供学习使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1022071

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的