【论文阅读】基于人工智能目标检测与跟踪技术的过冷流沸腾气泡特征提取

本文主要是介绍【论文阅读】基于人工智能目标检测与跟踪技术的过冷流沸腾气泡特征提取,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Bubble feature extraction in subcooled flow boiling using AI-based object detection and tracking techniques
基于人工智能目标检测与跟踪技术的过冷流沸腾气泡特征提取
期刊信息:International Journal of Heat and Mass Transfer 2024
级别:EI检索 SCI升级版工程技术2区 SCI基础版工程技术2区 IF5.2
原文链接:https://doi.org/10.1016/j.ijheatmasstransfer.2024.125188
演示视频:https://github.com/zhouzhouwen/Bubble_detection_and_tracking

气泡检测方法

本研究采用了2023年6月开发的最先进的基于CNN的YOLOv8。它表现出速度和精度的卓越平衡,从而将其建立为广泛任务的最佳选择,包括目标检测,目标跟踪,实例分割,图像分类和姿态估计。

基于YOLOv8的气泡检测算法由主干和头部两部分组成,如下图所示,主干组件作为特征提取器,用于从输入图像中提取高级特征。它从根本上使用了CSPDar - knet53特征提取器,并通过脚手架金字塔池特征(SPPF)层和额外的卷积层处理多个尺度的气泡特征图。C2f模块将这些高级特征与上下文信息相结合,从而提高了模型的气泡检测精度。header组件首先通过Concat层处理骨干生成的气泡特征映射,然后进行卷积和上行采样等操作。这些最后的结果然后被输入到Detection模块,最终输出气泡边界框、气泡类和分布焦点。头部结构针对速度和精度进行了优化。除了这些主要组件之外,YOLOv8还加入了Upsample和Concat层等辅助层,它们分别提高了特征图的分辨率,并促进了不同层特征图的组合。这些附加层共同提高了气泡检测算法的效率和有效性。
在这里插入图片描述

在YOLOv8的损失最小化过程中,Detection模块的输出与三种不同的损失相关:气泡边界框损失、气泡类损失和气泡分布焦点损失。气泡边界框损失是指真实的气泡边界框与YOLOv8预测的边界框之间的差异。模型对每个边界框进行4次预测,即中心坐标(x, y)和尺寸(宽度w,高度h)。边界框损失(boxloss)定义为:
在这里插入图片描述
预测的气泡边界框是b = (bx, by, bw, bh),实际的气泡边界框是b ’ = (b ’ x, b ’ y, b ’ w, b ’ h)。

为了解决每个边界框的类预测问题,YOLOv8利用了交叉熵损失函数。假设模型对每个类别的预测概率为p = (p1, p2,…pc),实际类别为c,则类别损失(clsloss)表示为:
在这里插入图片描述
pc是模型预测的正确类别的概率。在本研究中,类别分为两组,即气泡类别和背景类别。

为了解决类别不平衡的问题,YOLOv8 采用了焦点损失函数(dflloss),其定义为:
在这里插入图片描述
γ是一个通常设为2的超参数。焦点损失函数通过强化复杂样本的损失来缓解分类任务中的类不平衡,从而促使模型在训练时更多地关注这些样本。此外,YOLOv8提出了五个预定义模型,以满足不同范围的用例,考虑到计算效率和检测精度之间的平衡。这种灵活性使用户能够选择最适合其特定场景的方案,如表1所示。
在这里插入图片描述

以下指标通常用于衡量目标检测方法的性能。精度是衡量模型正面预测的准确度。数学上,精度计算为:
在这里插入图片描述
TP =真正例(正确识别的检测),FP =假正例(错误识别的检测)。召回:召回度量检测到的对象的数量。它量化了实际正确识别阳性的比例,定义为:
在这里插入图片描述
假反例(False Negatives, FN)表示漏检数。
Mean Average Precision (mAP@50): mAP@50以IoU (Intersection over Union)为阈值0.5(50%)计算召回值在0 ~ 1范围内的平均精度值的平均值。它提供了一个单一的度量,封装了精确度和召回率之间的权衡。IoU是用于对象检测的度量,用于量化对象检测器在特定数据集上的准确性。它测量两个边界框之间的重叠,如下图所示。
在这里插入图片描述
IoU的计算公式如下:
在这里插入图片描述
Mean Average Precision (mAP@50:95): mAP@50:95计算不同IoU阈值的平均精度,从0.5(50%)到0.95(95%),步长为0.05。它提供了一个模型在不同级别IoU上更全面的表现。mAP是一个介于0到1之间的值,mAP值越高,表示精度越高(假正例率低),召回率越高(假反例率低),这意味着模型正确识别对象,假正例或漏检较少。

气泡跟踪方法

多目标跟踪(MOT)算法是一种复杂的方法,可以在一个场景中同时跟踪多个目标。该技术包括检测每一帧内的对象,为每个对象分配唯一的ID,并在连续的帧中维持该ID,以构建随时间变化的对象轨迹。本研究将MOT算法与YOLOv8相结合,实现了在每个视频帧中检测到单个气泡后的跟踪。图6给出了气泡跟踪方法的一般流程。目前的气泡跟踪方法分为以下四个过程(图6):
图6
步骤1:气泡特征提取及位置预测。基于YOLOv8检测到冷凝气泡后,在后续帧中对每个气泡的轨迹进行投影。这就是调用卡尔曼滤波器的地方。卡尔曼滤波器根据当前状态估计冷凝气泡的未来状态。凝结泡的状态包括位置、速度和加速度。卡尔曼滤波器内的预测步长可以用数学形式表示为:
在这里插入图片描述
式中,
^xt为时刻t的预测状态,
Ft+1为时刻t到t+1的状态转移模型,
xt为时刻t的前一状态,
Bt+1为时刻t到t+1的控制输入模型,
ut+1为时刻t到t+1的控制向量,
t为时刻t的预测协方差,
^Pt为时刻t的前一协方差,
Ft+1是状态转移模型从时间t到时间t+1的转置,
Qt+1是时间t到时间t+1的过程噪声。

步骤2:级联匹配。级联匹配是一种机制,通过匈牙利算法,检测与基于跟踪的外观特征和外观相似性相匹配,这种方法建立了凝结气泡的短轨迹,从最近的检测开始,并向后追溯时间。

步骤3:IoU匹配。利用IoU匹配构造匈牙利算法的代价矩阵,便于跟踪的最优分配,生成关联结果。

步骤4:动作状态更新。基于卡尔曼滤波和运动预测模型对冷凝气泡轨迹的运动状态进行刷新。此外,对不相关的检测结果进行初始化,形成新的气泡轨迹。卡尔曼滤波器的更新方程如下:
在这里插入图片描述
式中,
Kt+1为t+1时刻的卡尔曼增益,
Ht+1为t - t+1时刻的观测模型,
Rt+1为t - t+1时刻的观测噪声协方差,
zt+1为t+1时刻的实际观测值,
I为单位矩阵。
冷凝气泡的轨迹如图6所示。

气泡检测结果

在这里插入图片描述
在这里插入图片描述

不同MOT算法的跟踪结果。在这里插入图片描述

结论与后续工作

在本研究中,提出了一种利用目标检测和跟踪技术提取鲁棒冷凝气泡特征的新方法——针对过冷流沸腾的分析。提出的人工智能模型在每个气泡的整个生命周期内有效地捕获时间和空间信息。有效地提取了过冷沸腾流中的关键热压参数,包括展弦比、Sauter平均直径、离开直径、生长时间和气泡寿命,并将其与经验相关性进行了比较。

此外,该模型能够量化过冷沸腾流中现有经验关联的近似偏差和波动幅度,这些关联大多是在稳定和充分发展的条件下发展起来的。对比结果显示了令人满意的一致性水平,进一步增强了我们提出的人工智能模型的有效性。该数据集将是开源的,使热水力领域的其他研究人员能够进行相关研究。

然而,值得注意的是,虽然目前的模型在提取热液参数方面表现出足够的性能,但用于训练和验证的当前数据集仅包含四组较低长/宽比的实验数据,以及25,000个注释的气泡数据点。因此,我们模型的通用性需要进一步改进。为了解决这一限制,我们正在获取具有更长的长/宽比的完整开发视频及其相应的综合数据集。这些新的数据集将用于训练一个更广义的气泡检测和跟踪模型。此外,我们正在进行的工作旨在提取和验证与视频长度密切相关的关键热水力参数,如空隙率、界面面积浓度、成核位点密度和Nu数。

这篇关于【论文阅读】基于人工智能目标检测与跟踪技术的过冷流沸腾气泡特征提取的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/752912

相关文章

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景