首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
tensorrtllm专题
使用docker部署tensorrtllm推理大模型baichuan2-7b
简介 大模型的推理框架,我之前用过vllm和mindie。近期有项目要用tensorrtllm,这里将摸索的过程记录下,特别是遇到的问题。 我的环境是Linux+rt3090 准备docker环境 本次使用docker镜像部署,需要从网上拉取: docker pull nvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3 The Tri
阅读更多...