首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
arxiv2211专题
【ARXIV2211】Efficient multi-order gated aggregation network
作者认为,交互复杂性是视觉识别一个重要特点。为此,作者通过复杂特征交互构建了一个纯卷积的网络 MogaNet 用于图像识别。MogaNet的整体框架如下图所示,架构和一般的 Transformer 网络非常类似,核心包括两个模块:spatial aggregation (取代注意力) 和 channel aggregation (取代FFN)。 (1)spatial aggregation
阅读更多...