【目标跟踪】奇葩需求如何处理(一)

2024-03-14 23:52

本文主要是介绍【目标跟踪】奇葩需求如何处理(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、前言
  • 二、奇葩需求
    • 2.1、减速带
    • 2.2、红绿灯
  • 三、后记

一、前言

  1. 工作中往往出现些奇葩需求。那个***需要跟踪,减速带、红绿灯、井盖,甚至是鸟、烟头、手指等。
  2. 今天就给大家分享下博主遇到那些奇葩需求,遇到了这些奇葩需求首先问候产品经理(斜眼笑.jpg)。
  3. 玩笑归玩笑,冷静下来还是要好好分析实际需求,想想如何解决这些实际问题。作为个优秀的工程师,解决问题才是关键。

二、奇葩需求

在低级别无人驾驶中,一般就是辅助倒车,辅助驾驶,辅助避让。或者说多数情况无人驾驶都是在特定的场景,如常说的高速场景。

而在高级别无人驾驶中如L4级别,要考虑的需求会大很多。当然,在 2024 年的今天,想在乘用车上实现无人驾驶还是有段距离,但在市场与政策双重刺激下,相信在不久的将来会实现。

今天给大家分享下一些在高级别无人驾驶过程中遇到的一些奇葩需求,遇到这些需求有哪些处理方法。

2.1、减速带

需求:当车体前方有减带时,我们要告知车子减速通行。

减速带在城市交通道路上是非常常见的。

图片名称

这个跟正常识别人、车等障碍物不太一样。类似减速带这类障碍物是可通行的,只是需要做减速通行。那么我们处理的逻辑就要改变。这里不仅仅是简单的检测。减速带的检测模型可以使用 segformer 模型或 TwinsNet 模型,也可以使用 yolo 系列做检测。

因为检测不可避免的存在错误检测。如果没有减速带检测出减速带,此时车子会出现明显卡顿,加速减速、加速减速,想想也知道场面多么滑稽。这里可以结合历史信息做一个平滑处理,主要是为了处理没有减速带而错误检测出减速带的情况。

    int num = (objectMessage->contours.size() != 0) ? 1: 0;resVec.push_back(num);sum += num;int length = resVec.size();if (length > maxLength) {sum -= resVec[0];resVec.erase(resVec.begin());length -= 1;}ans = (sum >= length * weight)? 1:0;  // 判断是否输出

2.2、红绿灯

图片名称

城市道路红绿灯特别场景,许多做智能驾驶厂家都吹嘘自己可以做的很好,实测上很难评([捂脸])。

红绿灯场景处理比较复杂主要几个方面

  1. 红绿灯目标小,难以稳定检测(不像人、车);且数据集少,标注成本大。
  2. 场景大多数存在多个红绿灯,难以把控这个红绿灯干嘛的,那个红绿灯干嘛的。
  3. 红绿灯灯的种类多,有人字的、有自信车形状的、有圆形的;红绿灯种类多,有放马路中央的,有几米高的,也有放地上的。
  4. 红绿灯识别完需要对红绿灯分类,黄灯、红灯、绿灯、没有灯等等。
  5. 红绿灯交通规则较为复杂,对路径规划提出较大要求。

综上所述,可以得知红绿灯场景处理起来的确费时费力,且效果不一定好。对于标注、规划等问题,这里不详细讲述。这里主要讲解跟踪逻辑。

检测红绿灯这个直接用我们 yolo 系列就足够了。颜色识别我们用颜色分类做。还需要结合历史信息综合判断,如在 1s 的连续帧不会红——>绿——>红来回跳动。可以根据国家红绿灯标准制定相应的策略,可以容忍unkonw。

目标跟踪选用 Bytetrack 或 BotSort。个人更加推荐 BotSort。原因是:(1)红绿灯目标小对匹配要求高(2)车子轻微抖动会影响跟踪

这里放一段开源 BotSort python 代码。如果想了解论文详细思想可以参考博主之前博客 https://blog.csdn.net/qq_49560248/article/details/136026766。

import cv2
import numpy as np
import copydef applyFeaures(self, raw_frame, detections=None):# Initializeheight, width, _ = raw_frame.shapeframe = cv2.cvtColor(raw_frame, cv2.COLOR_BGR2GRAY)H = np.eye(2, 3)# Downscale image (TODO: consider using pyramids)if self.downscale > 1.0:# frame = cv2.GaussianBlur(frame, (3, 3), 1.5)frame = cv2.resize(frame, (width // self.downscale, height // self.downscale))width = width // self.downscaleheight = height // self.downscale# find the keypointsmask = np.zeros_like(frame)# mask[int(0.05 * height): int(0.95 * height), int(0.05 * width): int(0.95 * width)] = 255mask[int(0.02 * height): int(0.98 * height), int(0.02 * width): int(0.98 * width)] = 255if detections is not None:for det in detections:tlbr = (det[:4] / self.downscale).astype(np.int_)mask[tlbr[1]:tlbr[3], tlbr[0]:tlbr[2]] = 0keypoints = self.detector.detect(frame, mask)# compute the descriptorskeypoints, descriptors = self.extractor.compute(frame, keypoints)# Handle first frameif not self.initializedFirstFrame:# Initialize dataself.prevFrame = frame.copy()self.prevKeyPoints = copy.copy(keypoints)self.prevDescriptors = copy.copy(descriptors)# Initialization doneself.initializedFirstFrame = Truereturn H# Match descriptors.knnMatches = self.matcher.knnMatch(self.prevDescriptors, descriptors, 2)# Filtered matches based on smallest spatial distancematches = []spatialDistances = []maxSpatialDistance = 0.25 * np.array([width, height])# Handle empty matches caseif len(knnMatches) == 0:# Store to next iterationself.prevFrame = frame.copy()self.prevKeyPoints = copy.copy(keypoints)self.prevDescriptors = copy.copy(descriptors)return Hfor m, n in knnMatches:if m.distance < 0.9 * n.distance:prevKeyPointLocation = self.prevKeyPoints[m.queryIdx].ptcurrKeyPointLocation = keypoints[m.trainIdx].ptspatialDistance = (prevKeyPointLocation[0] - currKeyPointLocation[0],prevKeyPointLocation[1] - currKeyPointLocation[1])if (np.abs(spatialDistance[0]) < maxSpatialDistance[0]) and \(np.abs(spatialDistance[1]) < maxSpatialDistance[1]):spatialDistances.append(spatialDistance)matches.append(m)meanSpatialDistances = np.mean(spatialDistances, 0)stdSpatialDistances = np.std(spatialDistances, 0)inliesrs = (spatialDistances - meanSpatialDistances) < 2.5 * stdSpatialDistancesgoodMatches = []prevPoints = []currPoints = []for i in range(len(matches)):if inliesrs[i, 0] and inliesrs[i, 1]:goodMatches.append(matches[i])prevPoints.append(self.prevKeyPoints[matches[i].queryIdx].pt)currPoints.append(keypoints[matches[i].trainIdx].pt)prevPoints = np.array(prevPoints)currPoints = np.array(currPoints)# Find rigid matrixif (np.size(prevPoints, 0) > 4) and (np.size(prevPoints, 0) == np.size(prevPoints, 0)):H, inliesrs = cv2.estimateAffinePartial2D(prevPoints, currPoints, cv2.RANSAC)# Handle downscaleif self.downscale > 1.0:H[0, 2] *= self.downscaleH[1, 2] *= self.downscaleelse:print('Warning: not enough matching points')# Store to next iterationself.prevFrame = frame.copy()self.prevKeyPoints = copy.copy(keypoints)self.prevDescriptors = copy.copy(descriptors)return H

关于红绿灯定位。这个光靠相机很难实现精准定位。一般需要地图信息辅助,视觉方面可以辅助区分相机大致位置如:左红绿灯是人行道 前红绿灯是机动车道。这里放一段博主初略估计的效果图

图片名称

三、后记

除了上面这些需求,博主还遇到更加奇葩的,今天就到这,下次分享更奇葩的。欢迎大家交流

这篇关于【目标跟踪】奇葩需求如何处理(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/810124

相关文章

百度OCR识别结构结构化处理视频

https://edu.csdn.net/course/detail/10506

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征 在机器学习领域,朴素贝叶斯是一种常用的分类算法,它的简单性和高效性使得它在实际应用中得到了广泛的应用。然而,在使用朴素贝叶斯算法进行分类时,我们通常会面临一个重要的问题,就是如何处理连续特征和离散特征。因为朴素贝叶斯算法基于特征的条件独立性假设,所以对于不同类型的特征,我们需要采取不同的处理方式。 在本篇博客中,我们将探讨如何有效地处理

3月份目标——刷完乙级真题

https://www.patest.cn/contests/pat-b-practisePAT (Basic Level) Practice (中文) 标号标题通过提交通过率1001害死人不偿命的(3n+1)猜想 (15)31858792260.41002写出这个数 (20)21702664840.331003我要通过!(20)11071447060.251004成绩排名 (20)159644

神经网络第四篇:推理处理之手写数字识别

到目前为止,我们已经介绍完了神经网络的基本结构,现在用一个图像识别示例对前面的知识作整体的总结。本专题知识点如下: MNIST数据集图像数据转图像神经网络的推理处理批处理  MNIST数据集          mnist数据图像 MNIST数据集由0到9的数字图像构成。像素取值在0到255之间。每个图像数据都相应地标有“7”、“2”、“1”等数字标签。MNIST数据集中,

vue怎么处理跨域

Vue.js 本身并不直接解决跨域问题,因为跨域问题主要是浏览器基于同源策略(Same-origin policy)的一种安全限制。然而,在Vue.js项目中,我们可以采取一些策略来绕过或处理跨域问题。 解决跨域问题的常用方法: 代理服务器:在开发环境中,我们可以配置一个代理服务器来转发API请求,从而绕过浏览器的同源策略。Vue CLI 提供了内置的代理功能,可以在 vue.config.j

【机器学习】自然语言处理的新前沿:GPT-4与Beyond

📝个人主页:哈__ 期待您的关注  目录 🔥引言 背景介绍 文章目的 一、GPT-4简介 GPT-4概述 主要特性 局限性和挑战 二、自监督学习的新进展 自监督学习的原理 代表性模型和技术 三、少样本学习和零样本学习 少样本学习的挑战 先进方法 四、跨模态学习 跨模态学习的概念 代表性技术 应用场景 第五部分:可解释性和透明性 AI的可解释

【文末附gpt升级秘笈】腾讯元宝AI搜索解析能力升级:千万字超长文处理的新里程碑

腾讯元宝AI搜索解析能力升级:千万字超长文处理的新里程碑 一、引言 随着人工智能技术的飞速发展,自然语言处理(NLP)和机器学习(ML)在各行各业的应用日益广泛。其中,AI搜索解析能力作为信息检索和知识抽取的核心技术,受到了广泛的关注和研究。腾讯作为互联网行业的领军企业,其在AI领域的探索和创新一直走在前列。近日,腾讯旗下的AI大模型应用——腾讯元宝,迎来了1.1.7版本的升级,新版本在AI搜

AndroidStudio打包处理

AndroidStudio非常强大,公司最近有一个需求是要实现对一个APP进行多个版本的打包,而且可以同时安装在手机上。这个需求详细一点的描述是:公司有一个APP,有多个开发商要使用我们的APP,为了大家都想有一个自己的APP,而且图标不一样,app名字不一样,背景不一样等。我查询了一下资料发现,在AndroidStudio的gradle是可以配置的。在此特意写一篇文章记录分享。 配置签名 首

【教师资格证考试综合素质——法律专项】学生伤害事故处理办法以及未成人犯罪法笔记相关练习题

目录 《学生伤害事故处理办法》 第一章 总 则 第二章 事故与责任 (谁有错,谁担责) 第三章  事故处理程序 第四章 事故损害的赔偿 第五章 事故责任者的处理 第六章 附 则 《中华人民共和国预防未成人犯罪法》 第一章 总 则 第二章 预防犯罪的教育 第三章 对不良行为的干预 第四章 对严重不良行为的矫治 第五章 对重新犯罪的预防 第六章法律责任 第七章 附 则