首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
a14b专题
Qwen2-MOE-57B-A14B模型结构解读
Qwen2-MOE-57B-A14B模型结构解读 模型代码文件下载 该模型总的参数为57B,激活参数为14B,推理速度比32B的快,而且性能更好。 Qwen2-MOE-57B-A14B模型总体结构 <class 'transformers.models.qwen2_moe.modeling_qwen2_moe.Qwen2MoeForCausalLM'>Qwen2MoeForCausa
阅读更多...