lrnet专题

Transformer系列-6丨LRNet和Stand-Alone Self-Attention网络解析

0. 前言本次主要分享之前看的两篇将自注意力机制self-attention应用在视觉感知任务的文章，分别为LRNet和Stand-alone self-attention。为了深化读者的理解，本文提供了较为详细的中文注释的代码。首先了解一下这两篇文章的背景，其都是在Vision Transformer（ViT）提出之前将transformer应用在感知任务上的尝试。尽管这些方法没有取得像