15+城市道路要素分割应用,用这一个分割模型就够了

2023-12-01 14:10

本文主要是介绍15+城市道路要素分割应用,用这一个分割模型就够了,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文已在飞桨公众号发布,查看请戳链接:
15+城市道路要素分割应用,用这一个分割模型就够了!

图像语义分割在计算机视觉中是一个经典且具有挑战性的任务。它旨在提供详细的像素级图像分类,相当于为每个像素分配语义标签。该技术目前被广泛应用于城市安防、路况判断等系统领域,比如地图导航的应用是通过分割识别建筑物、墙体、路面状况等道路要素,从而更准确地捕捉路面关键信息。

为了让大家能够更快速地上手技术,百度视觉技术部基于飞桨图像分割开发套件PaddleSeg提供了一套完整的城市街景道路要素分割产业实践范例,提供了从数据准备、模型训练及优化的全流程方案,降低产业落地门槛。这个项目中我们需要把19项关键目标分割出来,那么我们具体的方案思路是什么呢?

图片

图1 分割示例

点击GET项目链接

https://aistudio.baidu.com/aistudio/projectdetail/4038141?contributionType=1

所有源码及教程均已开源,欢迎大家使用。

项目难点

目标复杂

  • 道路复杂:包含直行,转弯,红绿灯路口等;

  • 环境复杂:要适应白天、黑夜、雾天和雨天等;

  • 场景复杂:城市道路、乡村、高速公路等场景差异性较大。

样本不均衡

  • 类别多:包含路面、人行道、建筑物、墙、栅栏、杆子、交通灯、交通标志、植被、地面、天空、人、骑车的人、车、卡车、巴士、火车、摩托车、自行车;

  • 不均衡:每张图像中最多会出现15辆车和30个行人,少时会出现2辆车且无行人,以及各种程度的遮挡与截断。

模型选择

主流的语义分割方案包括如下几个系列:

  • FCN(Fully Convolution Network):即全卷积网络,作为使用深度学习做图像分割的先例,其象征意义更大于实际意义。

  • U-Net系列:在UNet之前,主要的分割网络都是直筒式的,只使用顶层或后几层信息来上采样重建。而UNet是直接连接到输入端的卷积层。

  • DeepLab系列:DeepLab在图像分割领域中是另一个系列,目前已经有多个版本,和之前的UNet系列比起来,主要差别是在对输入图像的处理和网络的结构上。DeepLab主要使用了图像金字塔、空洞卷积、SPP空间金字塔池化、可分离卷积等方法来提高分割的效果。

  • HRNet系列:HRNet是2019年由微软亚洲研究院提出的一种全新的神经网络,不同于以往的卷积神经网络,该网络在网络深层仍然可以保持高分辨率,因此预测的语义信息更准确,在空间上也更精确。

  • Transformer系列:自从Transformer被引入计算机视觉以来,催生了大量相关研究与应用。在图像分割方向,涌现了像SETR、TransUNet、SegFormer、MaskFormer等基于Transformer的语义分割网络模型。打破了卷积结构在图像全局信息访问限制的问题。

由于分割目标较复杂,我们选取了精度表现较好的HRNet系列中MscaleOCRNet 模型进行后续实验,它SOTA的mIoU达到了87%。相比于HRNet网络结构,它是在分割后的结果上计算每个像素与图像其他像素的一个关系权重,与原特征进行一个叠加构成OCRNet网络,再基于OCRNet进行分层多尺度训练形成最终的 MscaleOCRNet,多尺度训练与推理方式如下图所示。

图片

图2 MscaleOCRNet 方案

算法优化

为了进一步提升精度,解决样本不均衡的问题,我们提供了以下优化思路:

  • 修改预训练模型:将mapillary预训练改为Cityscapes预训练模型,迁移至KITTI-STEP数据集训练可以有效提升分割效果;

  • 增加多尺度训练:由 [0.5,1.0] 两个尺度增加至 [0.5,1.0,2.0] 三个尺度;

  • 修改输入尺寸:修改输入尺寸由1024x512变为原图尺寸1248x384。

图片

使用工具

本项目使用PaddleSeg开发完成。PaddleSeg是基于飞桨PaddlePaddle开发的端到端图像分割开发套件,涵盖了高精度和轻量级等不同方向的大量高质量分割模型。通过模块化的设计,提供了配置化驱动和API调用两种应用方式,帮助开发者更便捷地完成从训练到部署的全流程图像分割应用。提供语义分割、交互式分割、全景分割、Matting四大图像分割能力。

模型部署

使用飞桨原生推理库Paddle Inference,用于服务端模型部署,总体上分为三步:

1. 创建PaddlePredictor,设置所导出的模型路径;

2. 创建输入用的PaddleTensor,传入到PaddlePredictor中;

3. 获取输出的PaddleTensor,将结果取出。

图片

如果想了解更详细方案细节,欢迎关注我们的直播课程,手把手全流程教学等着你哦。

精彩课程预告

为了让小伙伴们更便捷地应用范例教程,百度高级研发工程师将于6月23日(周四)20:00点为大家深度解析从数据准备、方案设计到模型优化部署的开发全流程,手把手教大家进行代码实践。

关注飞桨公众号报名直播课

加入技术交流群

引用说明:图2引用自“Hierarchical Multi-Scale Attention for Semantic Segmentation”

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

这篇关于15+城市道路要素分割应用,用这一个分割模型就够了的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/441466

相关文章

5分钟获取deepseek api并搭建简易问答应用

《5分钟获取deepseekapi并搭建简易问答应用》本文主要介绍了5分钟获取deepseekapi并搭建简易问答应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1、获取api2、获取base_url和chat_model3、配置模型参数方法一:终端中临时将加

JavaScript中的isTrusted属性及其应用场景详解

《JavaScript中的isTrusted属性及其应用场景详解》在现代Web开发中,JavaScript是构建交互式应用的核心语言,随着前端技术的不断发展,开发者需要处理越来越多的复杂场景,例如事件... 目录引言一、问题背景二、isTrusted 属性的来源与作用1. isTrusted 的定义2. 为

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

使用Python将长图片分割为若干张小图片

《使用Python将长图片分割为若干张小图片》这篇文章主要为大家详细介绍了如何使用Python将长图片分割为若干张小图片,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果1. Python需求

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单

《Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单》:本文主要介绍Springboot的ThreadPoolTaskScheduler线... 目录ThreadPoolTaskScheduler线程池实现15分钟不操作自动取消订单概要1,创建订单后

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链