本文主要是介绍LPD-Net学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
LPD-Net学习笔记
LPD-Net指 LPD-Net: 3D Point Cloud Learning for Large-Scale Place Recognition and Environment Analysis 文中所指LPD-Net。
本文主要依据网络结构图简单解释每个模块的作用。
Adaptive Local Feature Extraction
文中提到大尺度场景点云中每个点局部分布是不均匀的(可以理解为有的地方点密集、有的地方点稀疏)因此在使用KNN构建邻域图时需要自适应的选择K值,这样才能更好的提取点云特征。这里文章引用了Semantic 3d scene interpretation: a framework combining optimal neighborhood size selection with relevant features中的理论。利用公式Ei = -Li ln Li - Pi ln Pi - Si ln Si 来描述局部三维结构的不可预测性,从而可以选择使 Ei 取最小值时K的值作为为每个点构建邻域图时KNN算法的K值,所以这个模块中K值因点而异。
在构建完邻域图时将三维坐标和10个人工设置的特征串联输入mlp,mlp输出结果输入Feature Transform模块,这个模块文中提出了3种结构最终使用了FN-Parallel结构输出特征向量fF 和邻域关系向量fRT 邻域关系向量是通过将fF 输入T-Net后再对每个点使用KNN获得。
Graph-based Neighborhood Aggregation
这个模块主要是一个动态图卷积像DGCNN一样,另一个是固定图卷积,两者的区别就是动态图卷积依据点在特征空间中的距离构建邻域图(因此每一层邻域图的拓扑结构都是不同的),固定图卷积是依据点在笛卡尔坐标系中的距离(即真实空间距离)构建邻域图,因此图拓扑结构保持不变。
Feature Aggregation and Global Description
在网络的最后使用论文Netvlad: Cnn architecture for weakly supervised place recognition 中提出的结构获取描述点云的全局特征。
这篇关于LPD-Net学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!