本文主要是介绍DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
[论文链接]
\qquad 这篇文章中作者提出了一个支持动态特征聚合的网络DAR-Net。DAR-Net的核心思想是生成一个自适应的pooling skeleton,这个结构既考虑了场景的复杂结构也结合了局部几何特征。skeleton提供可变的半局部感受野和权重,成为了连接局部卷积特征提取器和全局循环特征聚合器的桥梁。
\qquad skeleton如上图所示,我的理解所谓skeleton就是一些能够反映点云集合特征的keypoint。
\qquad 网络的pipeline如上图所示,首先根据点云无监督、自适应地学习skeleton,使其合理分布在点云中。这个过程作用类似于从下图的a到b(node个数应人为指定)。
\qquad 然后从点云中学习局部的逐点特征,编码后的局部特征被动态地聚合到骨架中,作为信息抽象的中间尺度,得到node-wise的特征。
\qquad 定义 P N = { p i ∣ 0 < i ≤ N } P_N=\{p_i|0<i\leq N\} PN={pi∣0<i≤N}为点云, S M = { s j ∣ 0 < j ≤ M } S_M=\{s_j|0<j\leq M\} SM={sj∣0<j≤M}为pooling skeleton。 F a g g − i F^{agg-i} Fagg
这篇关于DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!