论文阅读: 1912.PointRend

本文主要是介绍论文阅读: 1912.PointRend，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1912.08193：PointRend: Image Segmentation as Rendering

中心思想

上采样过程中不断迭代（一般是迭代5次upsample_2x）的均匀采样是导致分割边缘不精细的原因：
- 规则网格（regular grid）会导致原本需要特殊关照的、所占像素区域极小的高频（重要）区域（非平滑边缘）被无差别对待。
对每次的上采样做一个精修后处理：
- 在不增加分辨率的前提下，可以借鉴计算机图像学中的图像渲染思想，设计新module，以迭代渲染出更高质量的分割图。
- 图像渲染中的adaptive subdivision策略：
  - 虽然输出是规则的，但计算时却不是均匀采样。通过仅对具有较高可能与其临近点的值明显不同的位置进行计算，对于其余位置的值均采用对 coarse grids 插值得到，以有效的渲染高分辨率的图像。
PointRend：
- PointRend（Point-based Rendering，基于点位的渲染）本质上是一种谁用谁涨点的上采样精修器。
- 位置：
  - 接在每个上采样之后。
  - 每次（双线性插值）上采样完都来精修一下边缘。
- 流程设计：
  - 1.选点：点选择策略（point selection strategy）。
  - 2.精修：MLP针对点位做二次预测。
- 点选择策略（point selection strategy）：
  - 设计：
    - train阶段：
      - 基于迭代的细分算法（iterative subdivision algorithm）：自适应随机采样（这N个点要倾向于不确定性高的边界区域，且有一定程度的均匀覆盖）：
        1.过采样，总共会随机采𝑘𝑁(𝑘>1)个点。
        2.从这𝑘𝑁个点中选择(𝛽𝑁)个最不确定的点。
        3.从剩下点中完全随机采样(1−𝛽)𝑁个点。
    - inference阶段：
      - 选取不确定性top的N个点（uncertain points），如二值pred mask中概率最接近0.5的点。
  - 计算量：
    - 对于一个目标为𝑀×𝑀的分割图，PointRend只需要𝑁𝑙𝑜𝑔2𝑀𝑀0次输出。对于𝑀=224，𝑀0=7本文选择𝑁=282，是原来的1/16。
- MLP（多层感知器，multi-layer perceptron）：
  - 是一个适用所有区域的conv_1*1的分类器，loss用ce。
  - 输入是所选点的4个最近邻的点（point-wise feature representation）。
  - 采用mildly biased方法（平衡explore和exploit），MLP能训练出最好的效果：

性能

分割效果：
可以灵活地用于实例分割和语义分割任务中。
在各种分割网络上，PointRend均能稳定涨1~2点。
模型太大，速度太慢。

论文阅读 - PointRend-Image Segmentation as Rendering
RESOURCES > BLOGS Detectron2 FPN + PointRend Model for amazing Satellite Image Segmentation
PointRend: Image Segmentation as Rendering
[论文阅读]PointRend: Image Segmentation as Rendering
论文速读：PointRend: Image Segmentation as Rendering

这篇关于论文阅读: 1912.PointRend的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！