adversial专题

P101 adversial attack 对抗攻击- 体现AI的不可靠

Attack x 与 x0 在一定误差内,两者之间的loss 越大越好 对抗攻击是指利用计算机系统或人工智能模型的弱点,通过修改输入数据,使得系统产生错误的结果或分类,而这种修改又对人类观察者来说几乎是无法察觉的。对抗攻击的目的在于欺骗或误导机器学习模型,使其在处理经过微小修改的输入数据时产生错误的输出。 关键点: 攻击类型: 梯度攻击: 通过计算模型对输入数据的梯度,并对输入数据进行微小