本文主要是介绍【语义分割】——又快又强:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
出处:哈尔滨工业大学
论文
code:暂未开源
关键词: 实时语义分割
语义分割是自动驾驶汽车了解周围场景的关键技术,对于实际的自动驾驶汽车来说,为了获得高精度的分割结果而花费大量的推理时间是不可取的。使用轻量级架构(编码器解码器或two-pathway)或推理在低分辨率图像。本文提出的模型在单张2080ti上DDRNet-slim能打到77.4% mIoU和230FPS,DDRNet-39能打到80.4% mIoU 和 23FPS
1. 简介
- 提出了一种新的深度双分辨率双边网络用于实时语义分割。
- 设计了一个新的模块,通过将特征聚合与金字塔池相结合来获取丰富的上下文信息。当它与低分辨率的特征映射集成时,推理时间几乎没有增加。
2. 相关工作
2.1 实时语义
实时语义分割主要从两个方面优化模型结构:1. 编码器-解码器结构; 2. 双通道结果(可以避免decoder时上采样操作带来的特征无法恢复问题)
3. 模型
文章借鉴了HRNet,重新设计了一个双分辨率的主干网络,并在ImageNet上重新训练。同时为了满足实时性的要求,网络是在resnet18,resnet34上修改而来。
3.1 主干网络
3.2 语义分割网络
-
整体网络
-
DAPPM上下文捕捉模块:更多尺度特征的融合
基于pspnet的特征金字塔池化和res2net,提出了一个DAPPM模块,用捕捉高层语义的上下文信息
-
深度监督:多个分支辅助监督学习
采用了pspnet中的deepsup思路,
4. 实验
不能说是最soa,但是速度是真的快
和start-of-art的比较
PPM 和 DAPPM 的比较
DDRNet和HRNetv2-w18 推理速度的比较
5. 总结
- DDRNet感觉是HRNet的一个简化,相当于只有两个分辨率,但是效果更好,归咎于resnet18的残差链接吗?
- DAPPM上下文特征模块,比PPM尺度更多,
- 这和SFNet一样,从resnet18出发来做实时语义分割backone。但是效果和精度确实比pspnet-resnet50还好。难道论文的改进点确实有效???
这篇关于【语义分割】——又快又强:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!