#每天一篇论文#241/365 DFF-DEN:基于带细节增强网络的深度特征流手部深度视频分割

本文主要是介绍#每天一篇论文#241/365 DFF-DEN:基于带细节增强网络的深度特征流手部深度视频分割,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DFF-DEN: DEEP FEATURE FLOW WITH DETAIL ENHANCEMENT NETWORK FOR HAND SEGMENTATION IN DEPTH VIDEO

在深度图连续帧上估计手势运动。通过使用一个轻量级的网络来估计流场和训练整个框架的端到端,DFF可以实现显著的加速,与一般视频分割任务中的每帧分割相比,具有中等精度的损失。然而,当这种方法应用于视频手部分割任务时,分割精度显著降低。原因是手是非刚性物体,不仅具有快速的位置位移,而且连续的手姿势变化在视频序列。

摘要

近年来,研究将基于CNN网络的分割方法从静止图像扩展到视频。在视频中直接应用基于帧的图像分割网络是不有效的。为了解决这个问题,一个有希望的方向是探索视频的连续性。一种最先进的方法称为深度特征流(DFF),它仅在稀疏关键帧上运行分割网络,并通过跨帧运动将特征映射传播到其他帧。然而,这种方法不能很好地用于手部分割在视频中,因为它是不鲁棒的手姿势改变。在本文中,我们提出将一个轻量级细节增强网络(DEN)纳入到DFF框架,以实现对横向帧运动和手姿势变化的鲁棒性。公开深度视频数据集FingerPaint实验结果表明,我们的方法实现了更高的分割精度比基于DFF的方法,类似的加速比基于帧的视频手分割方法。

贡献

为了解决上述问题,我们建议将轻量级细节增强网络(DEN)引入到DFF(10)框架中,以实现对交叉帧位置位移和连续手姿态变化的鲁棒性,以用于视频手部分割。具体地说,如图1(c)所示,除了使用流场来传播深特征图之外,我们还引入了一个辅助的轻型网络,并在每个图像帧上运行它来提取具有手部姿势细节的特征图。融合细节特征映射与传播的深度特征映射使得手部分割更加准确。在一个大型的公共深度视频数据集fingerpaint上的实验结果表明,我们的方法比最新的最先进的dff实现了更好的精度-速度权衡。

方法

不同手势分割算法对比,本文提出的DFF-DEN网络
在这里插入图片描述、网络结构
在这里插入图片描述

实验结果

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于#每天一篇论文#241/365 DFF-DEN:基于带细节增强网络的深度特征流手部深度视频分割的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/246049

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG