从 MLOps 到 MLOops:揭露机器学习平台的攻击面

2024-08-29 21:04

本文主要是介绍从 MLOps 到 MLOops:揭露机器学习平台的攻击面,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这篇文章包含的内容:

  • MLOps 能为您做什么

  • 固有漏洞与实施漏洞

  • MLOps 平台的固有漏洞
    • 恶意机器学习模型

    • 恶意数据集

    • Jupyter 沙盒逃逸

  • MLOps 平台中的实施漏洞
    • 缺乏身份验证

    • 容器逃逸

    • MLOps 平台不成熟

  • [攻击者如何将这些漏洞串联在一起?](https://jfrog.com/blog/from-mlops-to-mloops-exposing-the-attack-surface-of-machine-learning-platforms/#how would-an-attacker-chain-these-vulnerabilities-together)

  • 将 MLOps 功能映射到可能的攻击

  • 减轻部分攻击面

  • 在组织中部署 MLOps 平台的要点

MLOps 能为您做什么

在列出各种 MLOps 平台攻击之前,让我们先熟悉一些基本的 MLOps 概念。

图 1. ML 软件供应链

图 1. ML 软件供应链

构建和部署机器学习模型的常见生命周期包括:

  1. 选择机器学习算法(例如 SVM 或决策树)

  2. 将数据集提供给算法(“训练”模型)
    • 这将生成一个可以查询的“预训练”模型

  3. 可选——将预训练模型部署到模型注册表

  4. 将预训练模型部署到生产中,方法如下:
    • 嵌入到应用程序中

    • 将其部署到推理服务器(“模型服务”或“模型即服务”)

让我们更深入地了解每个步骤。

MLOps 管道

图 2. 常见 MLOps 管道的步骤

图 2. 常见 MLOps 管道的步骤

如上所述,MLOps 平台提供了构建和运行 ML 模型管道的能力。其理念是实现模型开发和部署各个阶段的自动化。

MLOps 管道与传统的 DevOps 管道类似。

例如,在 DevOps 管道中,我们可能会根据源代码更改执行每晚构建,但在 MLOps 管道中,我们可能会根据数据集更改执行每晚模型训练。

ML Pipelines 通常通过 Python 代码定义,管道代码监视数据集或模型参数的变化,然后训练新模型并对其进行评估,如果通过评估则将其部署到生产中。

例如,我们可以看到流行的Kubeflow平台的简化 Python 代码,该平台定义了一个 MLOps 管道,该管道基于存储在(Google)云存储中且可以不断更新的数据集来分析、转换、训练和评估机器学习模型

图 3. 简化的 ML Pipeline 代码(Kubeflow 框架)

图 3. 简化的 ML Pipeline 代码(Kubeflow 平台)

图 4. MLOps 管道(Kubeflow 框架)的图形表示

图 4. MLOps 管道的图形表示(Kubeflow 平台)

模型注册

在训练模型之后(无论是手动还是通过运行 ML 管道),跟踪预训练模型的最强大方法是使用模型注册表

图 5. 从模型注册表上传和下载模型

图 5. 从模型注册表上传和下载模型

模型注册表充当 ML 模型的版本控制机制。它是组织 ML 模型的唯一真实来源,可轻松获取特定模型版本、别名、标记等。

数据科学家使用训练数据来创建模型,然后协作并迭代不同的模型和模型的不同版本。

然后,机器学习工程师可以将其中一些模型推广到生产机器,然后这些模型将提供给能够查询它们的客户端。

ML 模型注册表的一个很好的例子是MLFlow,它是当今最流行的 MLOps 平台之一。

图 6. MLFlow 模型注册表

图 6. MLFlow 模型注册表

模型服务

当我们想要推广一个模型用于生产时,我们有两种选择,要么将模型嵌入到应用程序中,要么允许用户通过 API 查询模型,后者称为“模型服务”或“模型即服务”——

这篇关于从 MLOps 到 MLOops:揭露机器学习平台的攻击面的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1118887

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Android平台播放RTSP流的几种方案探究(VLC VS ExoPlayer VS SmartPlayer)

技术背景 好多开发者需要遴选Android平台RTSP直播播放器的时候,不知道如何选的好,本文针对常用的方案,做个大概的说明: 1. 使用VLC for Android VLC Media Player(VLC多媒体播放器),最初命名为VideoLAN客户端,是VideoLAN品牌产品,是VideoLAN计划的多媒体播放器。它支持众多音频与视频解码器及文件格式,并支持DVD影音光盘,VCD影