33b专题

【AI实战】llama.cpp 量化部署 llama-33B

【AI实战】llama.cpp 量化部署 llama-33B llama.cpp 量化介绍环境配置安装 llama.cpp拉取 llama.cpp 仓库代码编译llama.cpp 生成量化版本模型模型准备将上述.pth模型权重转换为ggml的FP16格式对FP16模型进行4-bit量化 推理速度测试加载并启动模型量化方法选择及推理速度33B推理速度表格 参考 llama.cpp 量

国产DeepSeek Coder 33B开源:创新代码AI,性能优于CodeLlama

引言 近日,国产AI领域迎来了一项重大突破:DeepSeek团队正式发布了DeepSeek Coder 33B模型,这一基于最新人工智能技术的代码生成模型不仅完全开源,而且在多项评测中显示出优于同类产品CodeLlama的卓越性能。 Huggingface模型下载: https://huggingface.co/deepseek-ai AI快站模型免费加速下载: https://aifas