triton inference server翻译之model managment

2024-01-23 17:32

本文主要是介绍triton inference server翻译之model managment,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

link

Model Management

推理服务器以以下三种模型控制模式之一进行操作:NONE,POLL或EXPLICIT。

Model Control Mode NONE

服务器尝试在启动时加载模型存储库中的所有模型。 服务器无法加载的模型在服务器状态中将标记为UNAVAILABLE,并且不可用于推理。

服务器运行时对模型存储库的更改将被忽略。 使用模型控制API的模型控制请求将不起作用,并且将收到错误响应。

启动推理服务器时,通过指定--model-control-mode = none来选择此模型控制模式。

Model Control Mode POLL

服务器尝试在启动时加载模型存储库中的所有模型。服务器无法加载的模型在服务器状态中将标记为UNAVAILABLE,并且不可用于推理。

将检测到对模型存储库的更改,并且服务器将根据这些更改尝试根据需要加载和卸载模型。可能无法立即检测到对模型存储库的更改,因为服务器会定期轮询存储库。您可以使用--repository-poll-secs选项控制轮询间隔。控制台日志或Status API可用于确定模型存储库更改何时生效。

使用模型控制API的模型控制请求将不起作用,并且将收到错误响应。

该模型控制模式是默认模式,但可以通过指定--model-control-mode = poll并将启动推理服务器时将--repository-poll-secs设置为非零值来显式启用。

在POLL模式下,推理服务器将响应以下模型存储库更改:

  • 通过添加和删除相应的版本子目录,可以从模型中添加和删除版本。推理服务器将允许正在进行的请求完成,即使它们正在使用模型的已删除版本也是如此。对删除模型版本的新请求将失败。根据型号的版本政策,对可用版本的更改可能会更改默认提供的型号版本。

  • 可以通过删除相应的模型目录从存储库中删除现有模型。推理服务器将允许对已删除模型的任何版本进行实时请求。对删除模型的新请求将失败。

  • 可以通过添加新模型目录将新模型添加到资源库中。

  • 可以更改模型配置(config.pbtxt),服务器将卸载并重新加载模型以获取新的模型配置。

  • 可以添加,删除或修改为表示分类的输出提供标签的标签文件,推理服务器将卸载并重新加载模型以拾取新标签。如果添加或删除了标签文件,则必须同时执行其在模型配置中对应的输出的label_filename属性的相应编辑。

Model Control Mode EXPLICIT

在启动时,服务器仅加载使用--load-model命令行选项明确指定的那些模型。 如果未指定--load-model,则启动时不会加载任何模型。 启动后,必须使用Model Control API显式启动所有模型加载和卸载操作。 模型控制请求的响应状态指示加载或卸载操作的成功或失败。

通过指定--model-control-mode = explicit启用此模型控制模式。

EXPLICIT模型控制模式是实验性的。 推理服务器将尝试使用框架后端提供的API来加载和卸载模型,但是至少某些后端可能难以管理重复的加载/卸载周期。

这篇关于triton inference server翻译之model managment的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/636996

相关文章

MySQL 中的服务器配置和状态详解(MySQL Server Configuration and Status)

《MySQL中的服务器配置和状态详解(MySQLServerConfigurationandStatus)》MySQL服务器配置和状态设置包括服务器选项、系统变量和状态变量三个方面,可以通过... 目录mysql 之服务器配置和状态1 MySQL 架构和性能优化1.1 服务器配置和状态1.1.1 服务器选项

查询SQL Server数据库服务器IP地址的多种有效方法

《查询SQLServer数据库服务器IP地址的多种有效方法》作为数据库管理员或开发人员,了解如何查询SQLServer数据库服务器的IP地址是一项重要技能,本文将介绍几种简单而有效的方法,帮助你轻松... 目录使用T-SQL查询方法1:使用系统函数方法2:使用系统视图使用SQL Server Configu

SQL Server数据库迁移到MySQL的完整指南

《SQLServer数据库迁移到MySQL的完整指南》在企业应用开发中,数据库迁移是一个常见的需求,随着业务的发展,企业可能会从SQLServer转向MySQL,原因可能是成本、性能、跨平台兼容性等... 目录一、迁移前的准备工作1.1 确定迁移范围1.2 评估兼容性1.3 备份数据二、迁移工具的选择2.1

SQL Server使用SELECT INTO实现表备份的代码示例

《SQLServer使用SELECTINTO实现表备份的代码示例》在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误,在SQLServer中,可以使用SELECTINT... 在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误。在 SQL Server 中,可以使用 SE

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

red5-server源码

red5-server源码:https://github.com/Red5/red5-server

MVC(Model-View-Controller)和MVVM(Model-View-ViewModel)

1、MVC MVC(Model-View-Controller) 是一种常用的架构模式,用于分离应用程序的逻辑、数据和展示。它通过三个核心组件(模型、视图和控制器)将应用程序的业务逻辑与用户界面隔离,促进代码的可维护性、可扩展性和模块化。在 MVC 模式中,各组件可以与多种设计模式结合使用,以增强灵活性和可维护性。以下是 MVC 各组件与常见设计模式的关系和作用: 1. Model(模型)