XGB-18:使用Concrete ML进行隐私保护推理

2024-03-08 03:04

本文主要是介绍XGB-18:使用Concrete ML进行隐私保护推理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

隐私保护推理是指以一种保护输入数据隐私的方式执行机器学习推理。这在处理敏感或个人信息时尤为重要,例如医疗记录或财务信息。实现隐私保护推理的一种方法是使用称为安全多方计算(SMC)的技术,该技术允许多个方在他们的输入上联合计算一个函数,而无需将这些输入透露给彼此。
Concrete ML是由Zama开发的一个专业库,它允许通过完全同态加密(FHE)在加密数据上执行机器学习模型,从而保护数据隐私。
要使用诸如XGBClassifier之类的模型,请使用以下导入方式:

from concrete.ml.sklearn import XGBClassifier

执行隐私保护推理

XGBClassifier的初始化可以按照以下方式进行:

classifier = XGBClassifier(n_bits=6, [other_hyperparameters])

其中 n_bits 决定了输入特征的精度。请注意,n_bits 的值越高,输入特征的精度和最终模型的准确性可能会提高,但也会导致更长的FHE执行时间。
xgboost库中存在的其他超参数也可以使用。

模型训练和编译

与scikit-learn中的模型类似,可以使用 .fit() 方法进行训练

classifier.fit(X_train, y_train)

训练完成后,可以使用校准数据集对模型进行编译,这个数据集可能是训练数据的一个子集:

classifier.compile(X_calibrate)

在这个校准数据集 X_calibrate 用于Concrete ML计算模型中每个中间值的精度(位数宽度)。这是优化等效FHE电路的必要步骤。

FHE模拟与执行

为了验证加密计算中的模型准确性,可以运行一个FHE模拟:

predictions = classifier.predict(X_test, fhe="simulate")

这个模拟可以用来评估模型。此模拟步骤得出的准确性代表了实际FHE执行的准确性,而不必支付实际FHE执行的成本。
当模型准备好后,可以进行实际的完全同态加密执行:

predictions = classifier.predict(X_test, fhe="execute")

请注意,使用 FHE=“execute” 是评估 FHE 中模型的一种方便方式,但对于实际部署,必须使用加密(在客户端)、在 FHE 中运行(在服务器端)和最后解密(在客户端)的函数,以实现端到端的隐私保护推理。
Concrete ML 提供了一个部署 API 以简化这个过程,确保端到端的隐私。
要进一步了解部署 API,可以阅读:

  • 部署文档
  • 部署notebook

Concrete ML中的参数调整

Concrete ML与标准的scikit-learn管道兼容,如GridSearchCV或其他任何超参数调整技术。

示例和演示

  • 情感分析(基于transformers + xgboost)
  • XGBoost分类器
  • XGBoost回归器

结论

Concrete ML提供了一个框架,通过利用完全同态加密来执行隐私保护推理,允许在加密数据上进行安全和私密的计算。
更多信息和示例可以在Concrete ML文档中找到。

参考

  • https://docs.zama.ai/concrete-ml

  • https://xgboost.readthedocs.io/en/latest/tutorials/privacy_preserving.html

  • https://www.youtube.com/watch?v=FFox2S4uqEo

这篇关于XGB-18:使用Concrete ML进行隐私保护推理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/785771

相关文章

Python使用PIL库将PNG图片转换为ICO图标的示例代码

《Python使用PIL库将PNG图片转换为ICO图标的示例代码》在软件开发和网站设计中,ICO图标是一种常用的图像格式,特别适用于应用程序图标、网页收藏夹图标等场景,本文将介绍如何使用Python的... 目录引言准备工作代码解析实践操作结果展示结语引言在软件开发和网站设计中,ICO图标是一种常用的图像

使用Java发送邮件到QQ邮箱的完整指南

《使用Java发送邮件到QQ邮箱的完整指南》在现代软件开发中,邮件发送功能是一个常见的需求,无论是用户注册验证、密码重置,还是系统通知,邮件都是一种重要的通信方式,本文将详细介绍如何使用Java编写程... 目录引言1. 准备工作1.1 获取QQ邮箱的SMTP授权码1.2 添加JavaMail依赖2. 实现

MyBatis与其使用方法示例详解

《MyBatis与其使用方法示例详解》MyBatis是一个支持自定义SQL的持久层框架,通过XML文件实现SQL配置和数据映射,简化了JDBC代码的编写,本文给大家介绍MyBatis与其使用方法讲解,... 目录ORM缺优分析MyBATisMyBatis的工作流程MyBatis的基本使用环境准备MyBati

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

使用Apache POI在Java中实现Excel单元格的合并

《使用ApachePOI在Java中实现Excel单元格的合并》在日常工作中,Excel是一个不可或缺的工具,尤其是在处理大量数据时,本文将介绍如何使用ApachePOI库在Java中实现Excel... 目录工具类介绍工具类代码调用示例依赖配置总结在日常工作中,Excel 是一个不可或缺的工http://

Java之并行流(Parallel Stream)使用详解

《Java之并行流(ParallelStream)使用详解》Java并行流(ParallelStream)通过多线程并行处理集合数据,利用Fork/Join框架加速计算,适用于大规模数据集和计算密集... 目录Java并行流(Parallel Stream)1. 核心概念与原理2. 创建并行流的方式3. 适

如何使用Docker部署FTP和Nginx并通过HTTP访问FTP里的文件

《如何使用Docker部署FTP和Nginx并通过HTTP访问FTP里的文件》本文介绍了如何使用Docker部署FTP服务器和Nginx,并通过HTTP访问FTP中的文件,通过将FTP数据目录挂载到N... 目录docker部署FTP和Nginx并通过HTTP访问FTP里的文件1. 部署 FTP 服务器 (

MySQL 日期时间格式化函数 DATE_FORMAT() 的使用示例详解

《MySQL日期时间格式化函数DATE_FORMAT()的使用示例详解》`DATE_FORMAT()`是MySQL中用于格式化日期时间的函数,本文详细介绍了其语法、格式化字符串的含义以及常见日期... 目录一、DATE_FORMAT()语法二、格式化字符串详解三、常见日期时间格式组合四、业务场景五、总结一、

Python中配置文件的全面解析与使用

《Python中配置文件的全面解析与使用》在Python开发中,配置文件扮演着举足轻重的角色,它们允许开发者在不修改代码的情况下调整应用程序的行为,下面我们就来看看常见Python配置文件格式的使用吧... 目录一、INI配置文件二、YAML配置文件三、jsON配置文件四、TOML配置文件五、XML配置文件