4B参数秒杀GPT-3.5：MiniCPM 3.0惊艳登场！

本文主要是介绍4B参数秒杀GPT-3.5：MiniCPM 3.0惊艳登场！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

面壁智能

在 AI 的世界里，总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0，这个仅有4B参数的"小钢炮"，正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。

MiniCPM 3.0

MiniCPM 3.0 目前的主要功能有：

长上下文功能：原生支持 32k 上下文长度，性能完美。我们引入了 LLM x MapReduce 方法，理论上可以处理长达无穷大的上下文长度。

出色的中英文教学跟随能力：超过 GLM-4-9B-Chat 和 Qwen2-7B-Instruct 的英语教学遵循 IFEval 和中文教学跟随 FollowBench-zh。

卓越的推理能力： 在数学能力方面，它优于 GPT-3.5-Turbo 和 MathBench 上的几个 7B-9B 模型。在极具挑战性的 LiveCodeBench 上，它超越了 Llama3.1-8B-Instruct。

支持函数调用🛠️和代码解释器：在伯克利函数调用排行榜（BFCL）上参数少于 9B 的模型中实现了 SOTA，性能优于 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

RAG 功能：我们发布了 MiniCPM RAG Suite。MiniCPM-Embedding 和 MiniCPM-Reranker 基于 MiniCPM 系列模型，在中英跨语言检索测试中实现了 SOTA 性能。MiniCPM3-RAG-LoRA 专为 RAG 场景设计，在开放域问答等多项任务上优于 Llama3-8B 和百川 2-13B 等模型。