本文主要是介绍机器学习笔记 - 用于动作识别的网络TSN/TSM/SlowFast/R(2+1)D/3D MobileNetV2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、简述
动作识别是在视频序列中检测和分类人类动作的过程。 近年来,由于其广泛的应用,它已成为一项越来越重要的技术,例如监控、人机交互以及视频索引和检索。 特别是,动作识别对于无人驾驶飞行器 (UAV) 或无人机来说变得至关重要,因为它们越来越多地用于各种应用,例如搜索和救援、环境监测和军事行动。
近年来,利用深度学习技术的动作识别领域取得了重大进展。人们已经提出了许多方法,包括双流 CNN、3D CNN 和基于注意力的模型。 这些方法在各种动作识别基准上都取得了最先进的性能。
二、一些主流网络
这里讨论模型在动作识别任务中实现高精度方面都显示出巨大的前景,但由于其体积大和计算要求高,它们可能不适合部署在边缘设备上。因为边缘设备上的动作识别模型需要轻量级和计算效率高,同时仍保持高精度(个人见解)。
1、Temporal Segment Networks(TSN)2016
时间段网络(TSN)是一种广泛使用的深度动作识别方法,旨在捕获视频中动作的时间动态。 该方法将视频帧分成几个等距的片段,并使用预训练的 2D CNN 从每个片段中提取特征。 然后使用共识函数(例如平均或最大池化)跨段聚合特征,以获得最终的视频级
这篇关于机器学习笔记 - 用于动作识别的网络TSN/TSM/SlowFast/R(2+1)D/3D MobileNetV2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!