【工程记录】ChatGLM3-6B微调实践的更新说明

2024-05-01 02:52

本文主要是介绍【工程记录】ChatGLM3-6B微调实践的更新说明,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 写在前面
  • 1. 环境依赖更新
  • 2. 微调数据格式更新
  • 3. 微调方式更新
  • 4. 微调后模型推理验证方式更新


写在前面

仅作个人学习记录用。本文对上一篇 【工程记录】ChatGLM3-6B微调实践(Windows) 的内容进行更新与补充说明。

1. 环境依赖更新

注意:ChatGLM3-6B 微调示例需要 python>=3.10;除基础的 torch 依赖外,其他重要依赖与上一篇文章发布时相比发生了变化:

protobuf>=4.25.3
transformers>=4.39.3
tokenizers>=0.15.0
cpm_kernels>=1.0.11
torch>=2.1.0
gradio>=4.26.0
sentencepiece>=0.2.0
sentence_transformers>=2.4.0
accelerate>=0.29.2
streamlit>=1.33.0
fastapi>=0.110.0
loguru~=0.7.2
mdtex2html>=1.3.0
latex2mathml>=3.77.0
jupyter_client>=8.6.1

2. 微调数据格式更新

ChatGLM3-6B模型的官方文档更新了微调示例。微调方法上,提供SFT,LoRA和 P-Tuning v2。格式上,提供多轮对话微调样例和输入输出格式微调样例。

如果想要使用自己的数据集进行模型微调,需要首先统一样例格式。同时,ChatGLM3-6B微调对话和微调工具能力的数据格式也不相同。

本文实践仅使用输入输出格式来微调对话,与上一篇文章发布时相比,输入输出格式要求发生了变化。我针对此变化编写了一段将上一篇文章发布时的输入输出格式转换成当前格式的代码:

import json
with open(".../train.jsonl", "r", encoding='utf-8') as f:data = [json.loads(line) for line in f]train_examples = [{'conversations': [{'role': 'user', 'content': x['promt']},{'role': 'assistant', 'content':x['response']}]} for x in data]with open(".../train.json", "wt", encoding='utf-8') as f:for e in train_examples:f.write(json.dumps(e, ensure_ascii=False) + '\n')

效果如下:

# 输入输出格式(前):
[{"prompt": "<prompt text>","response": "<response text>"}// ...
]# 输入输出格式(后):
```json
[{'conversations': [{'role': 'user', 'content': "<prompt text>"},{'role': 'assistant', 'content':"<response text>"}]}{'conversations': [{'role': 'user', 'content': "<prompt text>"},{'role': 'assistant', 'content':"<response text>"}]}...
]

作为示例,使用 AdvertiseGen 数据集进行微调实践。之前的train.jsonl格式如下:

[// ... {"prompt": "类型#上衣*版型#宽松*版型#显瘦*图案#线条*图案#刺绣*衣样式#针织衫*衣领型#v领","response": "一款温暖柔软又富有弹性的针织衫,不仅可以抵御严寒侵袭,还能更好地进行搭配。v领的设计,能勾勒出迷人的天鹅颈以及衬托出娇小的脸型。宽松又别致的剪裁,能从视觉上显露纤长的下半身,起到显瘦的效果。直筒造型的袖子,修饰出优美的手臂线条,衣身上的方格刺绣,时尚又吸睛。"}// ...
]

经过上述步骤得到train.json

[... {'conversations': [{'role': 'user', 'content': "类型#上衣*版型#宽松*版型#显瘦*图案#线条*图案#刺绣*衣样式#针织衫*衣领型#v领"},{'role': 'assistant', 'content':"一款温暖柔软又富有弹性的针织衫,不仅可以抵御严寒侵袭,还能更好地进行搭配。v领的设计,能勾勒出迷人的天鹅颈以及衬托出娇小的脸型。宽松又别致的剪裁,能从视觉上显露纤长的下半身,起到显瘦的效果。直筒造型的袖子,修饰出优美的手臂线条,衣身上的方格刺绣,时尚又吸睛。"}]}...
]

这样AdvertiseGen 数据集样本就满足了 ChatGLM3-6B 要求的输入输出格式,也可以根据上述多轮对话或输入输出格式准备个性化领域数据来微调模型。

注意:最新的微调代码中加入了验证集,因此,对于一组完整的微调数据集,必须包含训练数据集train.json和验证数据集dev.json,测试数据集可以不填写或者直接用验证数据集代替。

3. 微调方式更新

更新后的微调方式包括SFT,LoRA和 P-Tuning v2,非常简单,具体可参考【官方文档】。

注意:上一篇文章提到的 “ 需要将accelerate包的state.py文件中的backend='nccl’改为backend=‘gloo’ ”的问题 ,在目前的版本要求accelerate>=0.29.2下并不存在,直接忽略即可。

训练完成后,checkpoint 保存至你自己设置的output_dir位置(在configs文件夹对应的微调方式的yaml文件中)。

4. 微调后模型推理验证方式更新

更新后可使用 inference_hf.py 进行基本的推理验证。在finetune_demo 文件夹目录下,终端输入:

python inference_hf.py your_finetune_path --prompt [your prompt]

这篇关于【工程记录】ChatGLM3-6B微调实践的更新说明的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/950561

相关文章

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

防止Linux rm命令误操作的多场景防护方案与实践

《防止Linuxrm命令误操作的多场景防护方案与实践》在Linux系统中,rm命令是删除文件和目录的高效工具,但一旦误操作,如执行rm-rf/或rm-rf/*,极易导致系统数据灾难,本文针对不同场景... 目录引言理解 rm 命令及误操作风险rm 命令基础常见误操作案例防护方案使用 rm编程 别名及安全删除

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

ShardingProxy读写分离之原理、配置与实践过程

《ShardingProxy读写分离之原理、配置与实践过程》ShardingProxy是ApacheShardingSphere的数据库中间件,通过三层架构实现读写分离,解决高并发场景下数据库性能瓶... 目录一、ShardingProxy技术定位与读写分离核心价值1.1 技术定位1.2 读写分离核心价值二

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

MySQL分库分表的实践示例

《MySQL分库分表的实践示例》MySQL分库分表适用于数据量大或并发压力高的场景,核心技术包括水平/垂直分片和分库,需应对分布式事务、跨库查询等挑战,通过中间件和解决方案实现,最佳实践为合理策略、备... 目录一、分库分表的触发条件1.1 数据量阈值1.2 并发压力二、分库分表的核心技术模块2.1 水平分

SpringBoot通过main方法启动web项目实践

《SpringBoot通过main方法启动web项目实践》SpringBoot通过SpringApplication.run()启动Web项目,自动推断应用类型,加载初始化器与监听器,配置Spring... 目录1. 启动入口:SpringApplication.run()2. SpringApplicat

Redis中哨兵机制和集群的区别及说明

《Redis中哨兵机制和集群的区别及说明》Redis哨兵通过主从复制实现高可用,适用于中小规模数据;集群采用分布式分片,支持动态扩展,适合大规模数据,哨兵管理简单但扩展性弱,集群性能更强但架构复杂,根... 目录一、架构设计与节点角色1. 哨兵机制(Sentinel)2. 集群(Cluster)二、数据分片

Springboot项目构建时各种依赖详细介绍与依赖关系说明详解

《Springboot项目构建时各种依赖详细介绍与依赖关系说明详解》SpringBoot通过spring-boot-dependencies统一依赖版本管理,spring-boot-starter-w... 目录一、spring-boot-dependencies1.简介2. 内容概览3.核心内容结构4.