牛津大学和上海交大将SAM和Flow应用于移动目标，简单而有效，轻松分割运动目标！

本文主要是介绍牛津大学和上海交大将SAM和Flow应用于移动目标，简单而有效，轻松分割运动目标！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

光流可以在运动物体分割中发现运动物体并为分割提供清晰的边界。然而，如果物体暂时静止，就会面临分割挑战。

而我们知道SAM可以很好的分割静态图像对象。因此，是否可以利用SAM与光流结合来在视频中进行移动物体分割？

今天给大家介绍的这篇文章介绍并探索了两个模型，以利用SAM在视频中进行移动物体分割，使主要移动物体能够与背景运动区分开来。主要贡献有三个方面：

本文的目标是运动分割——发现和分割视频中的运动物体。这是一个被广泛研究的领域，有许多谨慎的，有时甚至是复杂的方法和训练方案，包括:自监督学习，从合成数据集学习，以对象为中心的表示，模态表示等等。我们在本文中感兴趣的是确定分段任意模型(SAM)是否可以为这项任务做出贡献。

我们研究了两种将SAM与光流相结合的模型，利用了SAM的分割能力和光流发现和分组运动物体的能力。首先，我们对SAM进行调整，使其将流(而不是RGB)作为输入。在第二个模型中，SAM以RGB作为输入，flow作为分割提示符。

这些令人惊讶的简单方法，无需任何进一步的修改，在单对象和多对象基准测试中都比以前的所有方法都要好得多。我们还将这些帧级分割扩展到保持对象身份的序列级分割。同样，这个简单的模型在多个视频对象分割基准上优于以前的方法。

将SAM应用于视频目标分割。

(a)流作为输入:flow-sam只接收光流并预测帧级分割掩码。
(b) flow-as-prompt: FlowP-SAM接受RGB并应用flow作为帧级分割提示符的信息。
(c)序列级掩码关联:作为后处理步骤，多掩码选择模块自回归从FlowI-SAM和/或FlowP-SAM转换帧级掩码输出并产生序列级掩码，其中对象标识在整个序列中是一致的。

flow-sam概述

FlowP-SAM概述

(a) FlowP-SAM的推理管道。
(b)体系结构FlowP-SAM。流提示生成器生成要注入的流提示类似sam的基于rgb的分段模块。两个模块取同一点提示令牌，从冻结的提示编码器获得。
(c)流量变压器的详细结构。译输入令牌作为轻量级查询的功能变压器解码器，迭代处理密集流特性。输出移动对象分数(MOS)令牌然后由基于mlp的头部处理以预测分数指示输入点提示符是否对应于移动对象。