triton inference server翻译之user guide

2024-01-23 17:32

本文主要是介绍triton inference server翻译之user guide,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

link

NVIDIA Triton Inference Server提供了针对NVIDIA GPU优化的云推理解决方案。 服务器通过HTTP或GRPC端点提供推理服务,从而允许远程客户端为服务器管理的任何模型请求推理。 对于边缘部署,Triton Server也可以作为带有API的共享库使用,该API允许将服务器的全部功能直接包含在应用程序中。

最新版是1.13.0

  • 更新KFserving HTTP/REST,GRPC协议和相应的python和c++的客户端库,参见Roadmap部分;
  • GRPC版本更新到1.24.0;
  • 解决部分s3存储问题;
  • 修复每个模型的last_inference_timestamp值;
  • 后续会移除对Caffe2模型的支持,所以不推荐使用;

特征

  • 多框架支持(Multiple framework support)
    • 管理任意数量和混合方式的模型;(受系统磁盘和内存资源限制)
    • 支持TensorRT, TensorFlow GraphDef, TensorFlow SavedModel, ONNX, PyTorch,Caffe2 NetDef模型;
    • 支持TensorFlow-TensorRT 和 ONNX-TensorRT整合模型;
    • 在框架和模型支持下,server同时支持可变大小的输入和输出;
    • 参见Capabilities模块
  • 模型并行支持(Concurrent model execution support)
    • 多模型可同时在一块GPU运行;
    • 单模型的多实例可在同一块GPU运行;
  • 支持批处理(Batching support)
    • 若模型支持批处理,server可接受批次请求并返回批次响应;
    • Server还支持多种调度和批处理算法,这些算法将单个推理请求组合在一起以提高推理吞吐量,且调度和批处理对客户端是透明的;
  • 一般后端支持(Custom backend support)
    • 支持单个模型可以有除了dl框架之外的其他普通后端处理;
    • 一般后端可以是任意逻辑,同时会受益于GPU的支持,并行,动态组批次和server所有的其他特性;
  • 支持集成(Ensemble support)
    • 一个管线(pipeline)可以是一个或多个模型的输入输出之间联结组合;
    • 单个请求会触发整个管线的执行;
  • 多GPU支持(Multi-GPU support)
    • 可以部署在系统所有的GPU上;
  • 多模型管理(multiple modes for model management)
    • 允许隐式和显式地加载和卸载模型,而无需重新启动服务器;
  • 模型仓库
    • 可以驻留在本地可访问文件系统(例如NFS),Google Cloud Storage或Amazon S3中;
  • 部署
    • 可用于任何编排或部署框架(例如Kubernetes)的就绪和活跃性健康端点;
  • 指标计算
    • GPU利用率,服务的吞吐和延迟;
  • c/c++部署
    • Triton Server的所有功能可包含在某个应用中;

这篇关于triton inference server翻译之user guide的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/637000

相关文章

mysql出现ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (10061)的解决方法

《mysql出现ERROR2003(HY000):Can‘tconnecttoMySQLserveron‘localhost‘(10061)的解决方法》本文主要介绍了mysql出现... 目录前言:第一步:第二步:第三步:总结:前言:当你想通过命令窗口想打开mysql时候发现提http://www.cpp

SQL Server清除日志文件ERRORLOG和删除tempdb.mdf

《SQLServer清除日志文件ERRORLOG和删除tempdb.mdf》数据库再使用一段时间后,日志文件会增大,特别是在磁盘容量不足的情况下,更是需要缩减,以下为缩减方法:如果可以停止SQLSe... 目录缩减 ERRORLOG 文件(停止服务后)停止 SQL Server 服务:找到错误日志文件:删除

Windows Server服务器上配置FileZilla后,FTP连接不上?

《WindowsServer服务器上配置FileZilla后,FTP连接不上?》WindowsServer服务器上配置FileZilla后,FTP连接错误和操作超时的问题,应该如何解决?首先,通过... 目录在Windohttp://www.chinasem.cnws防火墙开启的情况下,遇到的错误如下:无法与

一文详解SQL Server如何跟踪自动统计信息更新

《一文详解SQLServer如何跟踪自动统计信息更新》SQLServer数据库中,我们都清楚统计信息对于优化器来说非常重要,所以本文就来和大家简单聊一聊SQLServer如何跟踪自动统计信息更新吧... SQL Server数据库中,我们都清楚统计信息对于优化器来说非常重要。一般情况下,我们会开启"自动更新

JAVA虚拟机中 -D, -X, -XX ,-server参数使用

《JAVA虚拟机中-D,-X,-XX,-server参数使用》本文主要介绍了JAVA虚拟机中-D,-X,-XX,-server参数使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录一、-D参数二、-X参数三、-XX参数总结:在Java开发过程中,对Java虚拟机(JVM)的启动参数进

Windows server服务器使用blat命令行发送邮件

《Windowsserver服务器使用blat命令行发送邮件》在linux平台的命令行下可以使用mail命令来发送邮件,windows平台没有内置的命令,但可以使用开源的blat,其官方主页为ht... 目录下载blatBAT命令行示例备注总结在linux平台的命令行下可以使用mail命令来发送邮件,Win

MySQL 中的服务器配置和状态详解(MySQL Server Configuration and Status)

《MySQL中的服务器配置和状态详解(MySQLServerConfigurationandStatus)》MySQL服务器配置和状态设置包括服务器选项、系统变量和状态变量三个方面,可以通过... 目录mysql 之服务器配置和状态1 MySQL 架构和性能优化1.1 服务器配置和状态1.1.1 服务器选项

查询SQL Server数据库服务器IP地址的多种有效方法

《查询SQLServer数据库服务器IP地址的多种有效方法》作为数据库管理员或开发人员,了解如何查询SQLServer数据库服务器的IP地址是一项重要技能,本文将介绍几种简单而有效的方法,帮助你轻松... 目录使用T-SQL查询方法1:使用系统函数方法2:使用系统视图使用SQL Server Configu

SQL Server数据库迁移到MySQL的完整指南

《SQLServer数据库迁移到MySQL的完整指南》在企业应用开发中,数据库迁移是一个常见的需求,随着业务的发展,企业可能会从SQLServer转向MySQL,原因可能是成本、性能、跨平台兼容性等... 目录一、迁移前的准备工作1.1 确定迁移范围1.2 评估兼容性1.3 备份数据二、迁移工具的选择2.1

SQL Server使用SELECT INTO实现表备份的代码示例

《SQLServer使用SELECTINTO实现表备份的代码示例》在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误,在SQLServer中,可以使用SELECTINT... 在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误。在 SQL Server 中,可以使用 SE