adversial专题

P101 adversial attack 对抗攻击- 体现AI的不可靠

Attack x 与 x0 在一定误差内，两者之间的loss 越大越好对抗攻击是指利用计算机系统或人工智能模型的弱点，通过修改输入数据，使得系统产生错误的结果或分类，而这种修改又对人类观察者来说几乎是无法察觉的。对抗攻击的目的在于欺骗或误导机器学习模型，使其在处理经过微小修改的输入数据时产生错误的输出。关键点：攻击类型：梯度攻击：通过计算模型对输入数据的梯度，并对输入数据进行微小