siammae专题

【论文解读】SiamMAE：用于从视频中学习视觉对应关系的 MAE 简单扩展

来源：投稿作者：橡皮编辑：学姐论文链接：https://siam-mae-video.github.io/resources/paper.pdf 项目主页：https://siam-mae-video.github.io/ 1.背景时间是视觉学习背景下的一个特殊维度，它提供了一种结构，在该结构中，可以感知顺序事件、学习因果关系、跟踪物体在空间中的移动，以及预测未来事件

NeurIPS 2023 | 李飞飞团队提出SiamMAE：孪生掩码自编码器，刷榜视觉自监督方法

在计算机视觉领域，想要建立图像和场景（scene）之间之间的对应关系是一项比较困难的任务，尤其是在存在遮挡、视角改变或是物体外观发生变化的情况下。最近，斯坦福大学李飞飞团队对MAE进行扩展，提出了孪生掩码自编码器SiamMAE（Siamese Masked Autoencoders）以学习视频中的视觉对应关系。、图片论文链接（收录NeurIPS 2023 Oral）： https://s