新手教程之使用LLaMa-Factory微调LLaMa3

本文主要是介绍新手教程之使用LLaMa-Factory微调LLaMa3，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章目录

为什么要用LLaMa-Factory
什么是LLaMa-Factory
LLaMa-Factory环境搭建
微调LLaMA3
参考博文

为什么要用LLaMa-Factory

如果你尝试过微调大模型，你就会知道，大模型的环境配置是非常繁琐的，需要安装大量的第三方库和依赖，甚至需要接入一些框架。
但是大模型微调的方法又是非常类似的，那有没有一种工具可以统一这些操作，让大模型微调变成一个简单易上手的事情，LLaMa-Factory就是为了解决这个问题应运而生

什么是LLaMa-Factory

本来不想说这么多废话的，想来想去还是简单介绍一下，也加深自己的了解：
LLaMA Factory是一款支持多种LLM微调方式的工具，包括预训练、指令监督微调和奖励模型训练等。它支持LoRA和QLoRA微调策略，广泛集成了业界前沿的微调方法。特点在于支持多种LLM模型，提供了WebUI页面，使非开发人员也能方便进行微调工作。
代码地址：LLaMA-Factory

LLaMa-Factory环境搭建

克隆项目

git clone https://github.com/hiyouga/LLaMA-Factory.git

创建环境

conda create -n llama_factory python=3.10
conda activate llama_factory

安装依赖

cd LLaMA-Factory
pip install -e .[torch,metrics]

启动web UI界面

export CUDA_VISIBLE_DEVICES=0
python src/webui.py

启动成功之后，游览器会打开如下界面：
在这里插入图片描述

微调LLaMA3

准备模型

方法一：克隆我们要微调的模型到本地，然后将在web UI界面填入我们的模型名称和本地的模型地址

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

方法二：直接去魔塔Meta-Llama-3-8B-Instruct地址复制对应的文件名和路径，微调时，程序会自动去魔搭下载模型！
（这个方法小编浅浅试了一下，没成功，还是下载到本地靠谱）
在这里插入图片描述

准备数据集

LLaMA-Factory项目内置了丰富的数据集，统一存储于data目录下。
如果你想基于自己的数据集微调，你需要
（1）将你的数据集也放到data目录下
注意：你需要将你的数据集改为一样的格式，具体可参考data下内置数据集的格式
这里提供一个小编基于LooksJuicy/ruozhiba数据集改好的一个数据集：

https://pan.baidu.com/s/1FYYlBIXWy697xdagrHiIeg
提取码：2333

（2）修改data下的dataset_info.json文件，添加如下内容：
其中my_data.json是我自己的数据集文件，my_data是对应的数据集文件名

"my_data": {"file_name": "my_data.json"},

添加到第一层大括号内的第一个元素前，也就是identity前面

微调

这里我直接通过web ui界面进行微调
在这里插入图片描述

训练需要二十分钟左右，训练完成之后，会出现下述界面：
左下角会显示训练完毕，右边会出现训练过程中损失变化的一个可视化

在这里插入图片描述

与微调之后的模型对话

在这里插入图片描述
这样看来，使用LLaMa-Factory微调确实很简单方便！！！

参考博文

在Ubuntu上安装部署LLaMA-Factory，及微调大模型测试
使用LLaMA Factory微调LlaMA 3模型
llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换
动手微调Llama3！纯本地+手把手！ORPO偏好微调，数据集工具指南！base到chat模型微调方案！day01
Llama3 中文版模型微调笔记,小白也能学会

这篇关于新手教程之使用LLaMa-Factory微调LLaMa3的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

新手教程之使用LLaMa-Factory微调LLaMa3

文章目录

为什么要用LLaMa-Factory

什么是LLaMa-Factory

LLaMa-Factory环境搭建

微调LLaMA3

参考博文

相关文章

使用Python实现图像LBP特征提取的操作方法

Maven的使用和配置国内源的保姆级教程

Python中init方法使用的深度解析

SpringBoot使用GZIP压缩反回数据问题

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

Linux下如何使用C++获取硬件信息

Java使用SLF4J记录不同级别日志的示例详解

使用Python实现一个优雅的异步定时器

如何使用Nginx配置将80端口重定向到443端口

Java使用ANTLR4对Lua脚本语法校验详解