GAP:Skeleton-based Action Recognition

2024-01-14 05:28

本文主要是介绍GAP:Skeleton-based Action Recognition,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Generative Action Description Prompts for Skeleton-based Action Recognition解析

  • 摘要
  • 1.简介
  • 2. Related work
    • 2.1. Skeleton-based Action Recognition
    • 2.2 Human Part Prior
    • 2.3. Multi-modal Representation Learning
  • 3. 方法介绍
    • 3.1 生成动作提示框架
    • 3.2. Skeleton Encoder
    • 3.3. Text Encoder
    • 3.4. Action Description Learning
      • 骨架 - 语言对比学习:
      • Multi-part 对比学习:
    • 3.5 动作描述生成

论文链接:https://arxiv.org/abs/2208.05318
代码链接:https://github.com/MartinXM/GAP
论文出处:ICCV 2023
论文单位:香港理工大学

摘要

  • 基于骨骼的动作识别最近受到了相当大的关注。当前基于骨架的动作识别方法通常被表述为一个热门的分类任务,并且没有充分利用动作之间的语义关系。
  • 例如,“做胜利手势”和“竖起大拇指”是手势的两种动作,它们的主要区别在于手的动作。这些信息与动作类的分类编码无关,但可以从动作描述中揭示出来。
  • 因此,在训练中使用动作描述可能有利于表征学习。
  • 在这项工作中,我们提出了一种基于骨架的动作识别的生成动作描述提示(Generative Action-description Prompts,GAP)方法。
  • 具体而言,我们采用预训练的大规模语言模型作为知识引擎,自动生成动作肢体运动的文本描述,并提出了一种多模态训练方案,利用文本编码器生成不同肢体运动的特征向量,并监督骨架编码器进行动作表征学习。
  • 实验表明,我们提出的GAP方法在不增加推理计算成本的情况下,在各种基线模型上取得了显著的改进。
  • GAP在流行的基于骨架的动作识别基准上实现了最新的技术水平,包括NTU RGB+D, NTU RGB+D 120NW-UCLA

1.简介

  • 动作识别因其在人机交互、体育健康分析、娱乐等领域的广泛应用而成为一个活跃的研究课题。
  • 近年来,随着Kinect、RealSense等深度传感器的出现,人体关节可以很容易地获取。
  • 动作识别使用body关节等,基于骨架的动作识别由于其计算效率和对光照条件、视点变化和背景噪声的鲁棒性而受到广泛关注。
  • 以往的基于骨骼的动作识别方法大多侧重于对人体关节之间的关系进行建模,采用以一系列骨骼坐标作为输入的单模态训练方案。
  • 受最近图像和语言多模态训练成功的启发,我们研究了一个有趣的问题: 动作语言描述是否可以揭示动作关系并有利于基于骨架的动作识别?
  • 遗憾的是,由于缺乏由骨架文本对组成的大规模数据集,构建这样的数据集将需要大量的时间和财政资源。因此,该训练方案不能直接应用于基于骨架的动作识别。

这篇关于GAP:Skeleton-based Action Recognition的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/604070

相关文章

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

Unable to instantiate Action, goodsTypeAction, defined for 'goodsType_findAdvanced' in namespace '/

报错: Unable to instantiate Action, goodsTypeAction,  defined for 'goodsType_findAdvanced' in namespace '/'goodsTypeAction......... Caused by: java.lang.ClassNotFoundException: goodsTypeAction.......

用ajax json给后台action传数据要注意的问题

必须要有get和set方法   1 action中定义bean变量,注意写get和set方法 2 js中写ajax方法,传json类型数据 3 配置action在struts2中

使用http-request 属性替代action绑定上传URL

在 Element UI 的 <el-upload> 组件中,如果你需要为上传的 HTTP 请求添加自定义的请求头(例如,为了通过身份验证或满足服务器端的特定要求),你不能直接在 <el-upload> 组件的属性中设置这些请求头。但是,你可以通过 http-request 属性来自定义上传的行为,包括设置请求头。 http-request 属性允许你完全控制上传的行为,包括如何构建请求、发送请

MACS bdgdiff: Differential peak detection based on paired four bedGraph files.

参考原文地址:[http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html](http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html) 文章目录 一、MACS bdgdiff 简介DESCRIPTION 二、用法

Neighborhood Homophily-based Graph Convolutional Network

#paper/ccfB 推荐指数: #paper/⭐ #pp/图结构学习 流程 重定义同配性指标: N H i k = ∣ N ( i , k , c m a x ) ∣ ∣ N ( i , k ) ∣ with c m a x = arg ⁡ max ⁡ c ∈ [ 1 , C ] ∣ N ( i , k , c ) ∣ NH_i^k=\frac{|\mathcal{N}(i,k,c_{

Android Studio打开Modem模块出现:The project ‘***‘ is not a Gradle-based project

花了挺长时间处理该问题,特记录如下:1.背景: 在Android studio 下导入一个新增的modem模块,如MPSS.DE.3.1.1\modem_proc\AAA, 目的是看代码方便一些,可以自由搜索各种关键字。但导入该项目时出现了如下错误: The project '***' is not a Gradle-based project.造成的问题: (1) project 下没有代码,而

Flink整合Oozie Shell Action 提交任务带Kerberos认证

最近这段时间一直在忙新集群迁移,上了最新的cdh6.3.0 于是Flink 提交遇到了许多的问题,还好有cloudera License 有了原厂的帮助和社区的伙伴,问题解决起来快了不少。 集群具体情况是 CDH6.3.0 Flink1.8.1,整个数据平台全部组件都上了kerberos和ldap因为要过认证,所以任务提交方法我们选择统一Oozie提交任务,并且因为kerberos认证,还需要F

Servlet mapping specifies an unknown servlet name Action

看一下web.xml中<servlet-mapping>有没有配错

SIM(Search-based user interest modeling)

导读 我们对电商场景兴趣建模的理解愈发清晰:1. 通过预估目标item的信息对用户过去的行为做search提取和item相关的信息是一个很核心有效的技术。2. 更长的用户行为序列信息对CTR建模是非常有效且珍贵的。从用户的角度思考,我们也希望能关注用户长期的兴趣。但是当前的search方法无论是DIN和DIEN都不允许我们在线对一个超长的行为序列比如1000以上做有效搜索。所以我们的目标就比较明