34b专题

在AutoDL上部署Yi-34B大模型

在AutoDL上部署Yi-34B大模型 Yi介绍 Yi 系列模型是 01.AI 从零训练的下一代开源大语言模型。Yi 系列模型是一个双语语言模型，在 3T 多语言语料库上训练而成，是全球最强大的大语言模型之一。Yi 系列模型在语言认知、常识推理、阅读理解等方面表现优异。 Yi-34B-Chat 模型在 AlpacaEval Leaderboard 排名第二，仅次于 GPT-4 Turbo，

零一万物Yi-1.5开源，34B/9B/6B多尺寸，34B超Qwen1.5-72B

前言近年来，大型语言模型（LLM）在各个领域展现出惊人的能力，为人们的生活和工作带来了巨大的改变。然而，大多数开源 LLM 的性能仍然无法与闭源模型相媲美，这限制了 LLM 在科研和商业领域的进一步应用。为了推动 LLM 的开源发展，零一万物团队推出了全新一代的开源语言模型——Yi-1.5，并提供 34B/9B/6B 三种不同尺寸，旨在为研究人员和开发者提供更多选择，助力 LLM 的发展与应用

ValueError: Unrecognized configuration class ＜class transformers modules.AquilaChat2-34B-16K.config

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。本文主要介绍了ValueError: Unrecognized configuration class <class transformers mo

天鹰340亿(AquilaChat2-34B-16K)本地部署的解决方案

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了天鹰340亿(AquilaChat2-34B-16K)本地部署的解决

使用NVIDIA TensorRT-LLM支持CodeFuse-CodeLlama-34B上的int4量化和推理优化实践

本文首发于 NVIDIA 一、概述 CodeFuse（https://github.com/codefuse-ai）是由蚂蚁集团开发的代码语言大模型，旨在支持整个软件开发生命周期，涵盖设计、需求、编码、测试、部署、运维等关键阶段。为了在下游任务上获得更好的精度，CodeFuse 提出了多任务微调框架（MFTCoder），能够解决数据不平衡和不同收敛速度的问题。通过

SUS-Chat-34B领先一步：高效双语AI模型的突破

引言在人工智能领域，模型的规模和效能一直是衡量其先进性的关键指标。南方科技大学联合IDEA研究院CCNL团队最新开源的SUS-Chat-34B模型，以其340亿参数的庞大规模和卓越的双语处理能力，在AI界引起了广泛关注。模型概述 SUS-Chat-34B是基于01-ai/Yi-34B预训练模型，经过数百万高质量多语言指令数据微调而成的双语模型。它不仅继承了基础模型的强大语言能力，还通过高

使用autodl服务器，在A40显卡上运行， Yi-34B-Chat-int4模型，并使用vllm优化加速，显存占用42G，速度18 words/s

1，演示视频 https://www.bilibili.com/video/BV1gu4y1c7KL/ 使用autodl服务器，在A40显卡上运行， Yi-34B-Chat-int4模型，并使用vllm优化加速，显存占用42G，速度18 words/s 2，关于A40显卡，48GB 显存，安培架构 2020年，英伟达发布 A40 专业显卡，配备 48GB 显存。采用了

简单测试大语言模型 Yi-34B 的中日英能力

简单测试大语言模型 Yi-34B 的中日英能力 0. 背景1. 中文测试2. 日文测试3. 英文测试 0. 背景简单测试一下C-Eval 排行榜第一（20231129时点）的 Yi-34B 的中日英能力， 1. 中文测试问题1，回答正确。问题2，回答正确。问题3，回答正确。问题4，回答错误。正确答案：牛顿第二运动定律指出，物体的加速度与作用在其上