triton inference server翻译之model managment

2024-01-23 17:32

本文主要是介绍triton inference server翻译之model managment,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

link

Model Management

推理服务器以以下三种模型控制模式之一进行操作:NONE,POLL或EXPLICIT。

Model Control Mode NONE

服务器尝试在启动时加载模型存储库中的所有模型。 服务器无法加载的模型在服务器状态中将标记为UNAVAILABLE,并且不可用于推理。

服务器运行时对模型存储库的更改将被忽略。 使用模型控制API的模型控制请求将不起作用,并且将收到错误响应。

启动推理服务器时,通过指定--model-control-mode = none来选择此模型控制模式。

Model Control Mode POLL

服务器尝试在启动时加载模型存储库中的所有模型。服务器无法加载的模型在服务器状态中将标记为UNAVAILABLE,并且不可用于推理。

将检测到对模型存储库的更改,并且服务器将根据这些更改尝试根据需要加载和卸载模型。可能无法立即检测到对模型存储库的更改,因为服务器会定期轮询存储库。您可以使用--repository-poll-secs选项控制轮询间隔。控制台日志或Status API可用于确定模型存储库更改何时生效。

使用模型控制API的模型控制请求将不起作用,并且将收到错误响应。

该模型控制模式是默认模式,但可以通过指定--model-control-mode = poll并将启动推理服务器时将--repository-poll-secs设置为非零值来显式启用。

在POLL模式下,推理服务器将响应以下模型存储库更改:

  • 通过添加和删除相应的版本子目录,可以从模型中添加和删除版本。推理服务器将允许正在进行的请求完成,即使它们正在使用模型的已删除版本也是如此。对删除模型版本的新请求将失败。根据型号的版本政策,对可用版本的更改可能会更改默认提供的型号版本。

  • 可以通过删除相应的模型目录从存储库中删除现有模型。推理服务器将允许对已删除模型的任何版本进行实时请求。对删除模型的新请求将失败。

  • 可以通过添加新模型目录将新模型添加到资源库中。

  • 可以更改模型配置(config.pbtxt),服务器将卸载并重新加载模型以获取新的模型配置。

  • 可以添加,删除或修改为表示分类的输出提供标签的标签文件,推理服务器将卸载并重新加载模型以拾取新标签。如果添加或删除了标签文件,则必须同时执行其在模型配置中对应的输出的label_filename属性的相应编辑。

Model Control Mode EXPLICIT

在启动时,服务器仅加载使用--load-model命令行选项明确指定的那些模型。 如果未指定--load-model,则启动时不会加载任何模型。 启动后,必须使用Model Control API显式启动所有模型加载和卸载操作。 模型控制请求的响应状态指示加载或卸载操作的成功或失败。

通过指定--model-control-mode = explicit启用此模型控制模式。

EXPLICIT模型控制模式是实验性的。 推理服务器将尝试使用框架后端提供的API来加载和卸载模型,但是至少某些后端可能难以管理重复的加载/卸载周期。

这篇关于triton inference server翻译之model managment的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/636996

相关文章

python连接本地SQL server详细图文教程

《python连接本地SQLserver详细图文教程》在数据分析领域,经常需要从数据库中获取数据进行分析和处理,下面:本文主要介绍python连接本地SQLserver的相关资料,文中通过代码... 目录一.设置本地账号1.新建用户2.开启双重验证3,开启TCP/IP本地服务二js.python连接实例1.

Pydantic中model_validator的实现

《Pydantic中model_validator的实现》本文主要介绍了Pydantic中model_validator的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录引言基础知识创建 Pydantic 模型使用 model_validator 装饰器高级用法mo

mysql出现ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (10061)的解决方法

《mysql出现ERROR2003(HY000):Can‘tconnecttoMySQLserveron‘localhost‘(10061)的解决方法》本文主要介绍了mysql出现... 目录前言:第一步:第二步:第三步:总结:前言:当你想通过命令窗口想打开mysql时候发现提http://www.cpp

GORM中Model和Table的区别及使用

《GORM中Model和Table的区别及使用》Model和Table是两种与数据库表交互的核心方法,但它们的用途和行为存在著差异,本文主要介绍了GORM中Model和Table的区别及使用,具有一... 目录1. Model 的作用与特点1.1 核心用途1.2 行为特点1.3 示例China编程代码2. Tab

SQL Server清除日志文件ERRORLOG和删除tempdb.mdf

《SQLServer清除日志文件ERRORLOG和删除tempdb.mdf》数据库再使用一段时间后,日志文件会增大,特别是在磁盘容量不足的情况下,更是需要缩减,以下为缩减方法:如果可以停止SQLSe... 目录缩减 ERRORLOG 文件(停止服务后)停止 SQL Server 服务:找到错误日志文件:删除

Windows Server服务器上配置FileZilla后,FTP连接不上?

《WindowsServer服务器上配置FileZilla后,FTP连接不上?》WindowsServer服务器上配置FileZilla后,FTP连接错误和操作超时的问题,应该如何解决?首先,通过... 目录在Windohttp://www.chinasem.cnws防火墙开启的情况下,遇到的错误如下:无法与

一文详解SQL Server如何跟踪自动统计信息更新

《一文详解SQLServer如何跟踪自动统计信息更新》SQLServer数据库中,我们都清楚统计信息对于优化器来说非常重要,所以本文就来和大家简单聊一聊SQLServer如何跟踪自动统计信息更新吧... SQL Server数据库中,我们都清楚统计信息对于优化器来说非常重要。一般情况下,我们会开启"自动更新

JAVA虚拟机中 -D, -X, -XX ,-server参数使用

《JAVA虚拟机中-D,-X,-XX,-server参数使用》本文主要介绍了JAVA虚拟机中-D,-X,-XX,-server参数使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录一、-D参数二、-X参数三、-XX参数总结:在Java开发过程中,对Java虚拟机(JVM)的启动参数进

Windows server服务器使用blat命令行发送邮件

《Windowsserver服务器使用blat命令行发送邮件》在linux平台的命令行下可以使用mail命令来发送邮件,windows平台没有内置的命令,但可以使用开源的blat,其官方主页为ht... 目录下载blatBAT命令行示例备注总结在linux平台的命令行下可以使用mail命令来发送邮件,Win

MySQL 中的服务器配置和状态详解(MySQL Server Configuration and Status)

《MySQL中的服务器配置和状态详解(MySQLServerConfigurationandStatus)》MySQL服务器配置和状态设置包括服务器选项、系统变量和状态变量三个方面,可以通过... 目录mysql 之服务器配置和状态1 MySQL 架构和性能优化1.1 服务器配置和状态1.1.1 服务器选项