开源的代码语言模型DeepSeek-Coder-V2；Runway推出Gen-3；多层架构整合多个大语言模型；大规模钢琴手部动作数据集和基准

本文主要是介绍开源的代码语言模型DeepSeek-Coder-V2；Runway推出Gen-3；多层架构整合多个大语言模型；大规模钢琴手部动作数据集和基准，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

✨ 1: DeepSeek-Coder-V2

开源的多专家代码语言模型，支持338种编程语言。

DeepSeek-Coder-V2 是一个开源的代码语言模型，专为代码生成、代码补全、代码修复以及数学推理等任务而设计。该模型通过在大量高质量的多源语料库上进一步训练，显著提升了其在代码生成和数学推理方面的能力，同时在一般语言任务中的表现也保持在同等水平。DeepSeek-Coder-V2 支持 338 种编程语言并将上下文长度从 16K 扩展到 128K。该模型分为 16B 和 236B 参数版本，且在多项基准测试中表现优越，甚至在某些任务上超越了如 GPT4-Turbo 等闭源模型。

模型地址：https://huggingface.co/collections/deepseek-ai/deepseekcoder-v2-666bf4b274a5f556827ceeca

地址：https://github.com/deepseek-ai/DeepSeek-Coder-V2

✨ 2: Gen-3 Alpha

由Runway推出的高保真可控视频生成模型。

Gen-3 Alpha 是由 Runway 研发的最新一代视频生成模型，其在保真度、一致性和运动方面相较于 Gen-2 有重大突破，朝着建立通用世界模型的方向迈进了一步。该模型为 Runway 的文本生成视频、图像生成视频及文本生成图像工具提供动力，并支持现有的控制模式如运动画笔、高级相机控制和导演模式等，以及即将推出的更精细控制结构、风格和运动的新工具。

Gen-3 Alpha 能够生成高度逼真的人类角色，具备多样的动作、手势和情感，适合讲述更丰富的故事。其训练过程融合了视频和图像，且模型接受了详尽的时间密集型字幕训练，从而能够实现富有想象力的过渡和精确的关键帧控制。

此外，Gen-3 Alpha 还配备了全新的视觉审核系统和 C2PA 版权标准，为用户提供更安全的使用体验。对于有定制需求的行业客户，Runway 提供了专属模型定制服务，以满足特定的艺术和叙事需求。

Gen-3 Alpha 的开发是研究科学家、工程师和艺术家跨学科合作的成果，旨在解释各种风格和电影术语，推动视频生成进入新的前沿。

地址：https://runwayml.com/blog/introducing-gen-3-alpha/

✨ 3: Mixture-of-Agents

Mixture-of-Agents通过多层架构整合多个大语言模型，显著提升其性能表现

Mixture of Agents (MoA) 是一种新颖的方法，通过利用多个大型语言模型（LLM）的集体优势，显著提高性能，实现了最先进的效果。MoA采用分层架构，每一层由多个LLM代理组成，相比之下，MoA在AlpacaEval 2.0上的得分为65.1%，远超GPT-4 Omni的57.5%，而且仅使用开源模型。

MoA在AlpacaEval 2.0和MT-Bench排行榜上取得了领先位置。特别是在AlpacaEval 2.0上，仅使用开源模型，实现了从57.5% (GPT-4 Omni) 到65.1% (MoA) 的绝对提升7.6%。

地址：https://github.com/togethercomputer/moa