首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
57b专题
第三十篇-Ollama-TeslaP40-Ollama-Qwen2-57B等速度
系列文章 第二十四篇-Ollama-在线安装 第二十五篇-Ollama-离线安装 第二十六篇-Ollama-监听本地IP与端口 第二十七篇-Ollama-加载本地模型文件 第二十八篇-Ollama-TeslaP40-Ollama-8B-Qwen1.5-32B等速度 第三十篇-Ollama-TeslaP40-Ollama-Qwen2-57B等速度 环境 系统:CentOS-7CPU: 14C
阅读更多...
Qwen2-MOE-57B-A14B模型结构解读
Qwen2-MOE-57B-A14B模型结构解读 模型代码文件下载 该模型总的参数为57B,激活参数为14B,推理速度比32B的快,而且性能更好。 Qwen2-MOE-57B-A14B模型总体结构 <class 'transformers.models.qwen2_moe.modeling_qwen2_moe.Qwen2MoeForCausalLM'>Qwen2MoeForCausa
阅读更多...