本文主要是介绍【开源实验】模型窃取(KnockoffNet),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
简介
使用KnockoffNet方法对预训练的Resnet50模型进行模型窃取攻击(model stealing attack)
实验设置
数据集(dataset):CIFAR、MNIST
预训练模型(pretrained model):Resnet50
受害者模型(victim model):Resnet50
窃取方法(stealing method):KnockoffNet
查询次数:10k, 20k, 30k, 40k, 50k
实验结果
补充
KnockoffNet方法
该方法来自论文《Knockoff Nets: Stealing Functionality of Black-Box Models》
论文由Tribhuvanesh Orekondy、Bernt Schiele和Mario Fritz撰写,探讨了在黑盒环境中,即只能通过输入图像并观察输出预测的情况下,攻击者能多大程度上复制一个“受害者”模型的功能
论文将模型功能窃取定义为一个两阶段的过程:
(i) 查询一组输入图像以获得黑盒模型的预测;
(ii) 使用查询到的图像-预测对训练一个“仿冒品”模型。
参考
代码链接
论文链接
这篇关于【开源实验】模型窃取(KnockoffNet)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!