【语义分割】——又快又强：Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road

本文主要是介绍【语义分割】——又快又强：Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

出处：哈尔滨工业大学
论文
code：暂未开源
关键词： 实时语义分割

在这里插入图片描述

语义分割是自动驾驶汽车了解周围场景的关键技术，对于实际的自动驾驶汽车来说，为了获得高精度的分割结果而花费大量的推理时间是不可取的。使用轻量级架构(编码器解码器或two-pathway)或推理在低分辨率图像。本文提出的模型在单张2080ti上DDRNet-slim能打到77.4% mIoU和230FPS，DDRNet-39能打到80.4% mIoU 和 23FPS

1. 简介

提出了一种新的深度双分辨率双边网络用于实时语义分割。
设计了一个新的模块，通过将特征聚合与金字塔池相结合来获取丰富的上下文信息。当它与低分辨率的特征映射集成时，推理时间几乎没有增加。

2. 相关工作

2.1 实时语义
实时语义分割主要从两个方面优化模型结构：1. 编码器-解码器结构； 2. 双通道结果（可以避免decoder时上采样操作带来的特征无法恢复问题）
在这里插入图片描述

3. 模型

文章借鉴了HRNet，重新设计了一个双分辨率的主干网络，并在ImageNet上重新训练。同时为了满足实时性的要求，网络是在resnet18，resnet34上修改而来。
3.1 主干网络
在这里插入图片描述
3.2 语义分割网络

整体网络
DAPPM上下文捕捉模块：更多尺度特征的融合
基于pspnet的特征金字塔池化和res2net，提出了一个DAPPM模块，用捕捉高层语义的上下文信息
深度监督：多个分支辅助监督学习
采用了pspnet中的deepsup思路，

4. 实验

不能说是最soa，但是速度是真的快
在这里插入图片描述
和start-of-art的比较

PPM 和 DAPPM 的比较

DDRNet和HRNetv2-w18 推理速度的比较

5. 总结

DDRNet感觉是HRNet的一个简化，相当于只有两个分辨率，但是效果更好，归咎于resnet18的残差链接吗？
DAPPM上下文特征模块，比PPM尺度更多，
这和SFNet一样，从resnet18出发来做实时语义分割backone。但是效果和精度确实比pspnet-resnet50还好。难道论文的改进点确实有效？？？

这篇关于【语义分割】——又快又强：Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！