本文主要是介绍dert论文笔记(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
把这个编码器的自注意给可视化出来。我们在每个牛身上找一个基准点,然后我们用这个点和图像上其他点算自注意力,我们会发现他已经做的很好了。已经接近实力分割里面的mask的形状。我们在这个基础上去做decoder 或者目标检测 或者实力分割 任务 都会简单很多。
decoder中也自注意力机制,我们把每个物体自注意力用用不同颜色表现出来。
encorder学的是全局特征,能基本把物体分开,但是这还不够 decoder就是把边缘这些头 尾巴这些给区分开
object query的可视化。在coco验证集里面得到的输出框可视化出来。n=100 这里只是20个object query。绿色的代表小的bbx 红色代表大的横向的bbxc蓝色代表竖向的大的bbx.其实object query 就是像问问题的人一样。
##总结
他是一个全新的做目标检测的框架,主要利用了transforms和二分图匹配,实现了端到端学习的网络,在coco上和fast rcnn打成平手。在全景分割上取得了更好的结果。因为他的简单应用性 他有很大的潜力应用到别的任务上。
这篇关于dert论文笔记(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!