YOLOV8改进：CVPR2023：加入EfficientViT主干：具级联组注意力的访存高效ViT

本文主要是介绍YOLOV8改进：CVPR2023：加入EfficientViT主干：具级联组注意力的访存高效ViT，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1.该文章属于YOLOV5/YOLOV7/YOLOV8改进专栏，包含大量的改进方式，主要以2023年的最新文章和2022年的文章提出改进方式。
2.提供更加详细的改进方法，如将注意力机制添加到网络的不同位置，便于做实验，也可以当做论文的创新点。
2.涨点效果：添加EfficientViT，有效涨点。

论文地址

视觉变压器由于其高模型能力而取得了巨大的成功。然而，它们卓越的性能伴随着沉重的计算成本，这使得它们不适合实时应用。在这篇论文中，我们提出了一个高速视觉变压器家族，名为EfficientViT。我们发现现有的变压器模型的速度通常受到内存低效操作的限制，特别是在MHSA中的张量重塑和单元函数。因此，我们设计了一种具有三明治布局的新构建块，即在高效FFN层之间使用单个内存绑定的MHSA，从而提高了内存效率，同时增强了信道通信。此外，我们发现注意图在头部之间具有很高的相似性，从而导致计算冗余。为了解决这个问题，我们提出了一个级联的群体注意模块，以不同的完整特征分割来馈送注意头，不仅节省了计算成本，而且提高了注意多样性。综合实验表明，高效vit优于现有的高效模型，在速度和精度之间取得了良好的平衡。例如，我们的EfficientViT-M5在准确率上比MobileNetV3-Large高出1.9%，而在Nvidia V100 GPU和Intel Xeon CPU上的吞吐量分别高出40.4%和45.2%。

这篇关于YOLOV8改进：CVPR2023：加入EfficientViT主干：具级联组注意力的访存高效ViT的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！