Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors

本文主要是介绍Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors

这篇文章提出了一种新的视频表示方法,叫做trajectory-pooled deep-convolutional descriptor(TDD)。他拥有手工设计的特征和深度学习的特征的优点。用深度结构来学习有区分的卷积特征映射。然后用轨迹控制的pooling方法来融合这些卷积特征。

本文设计了两种正则化的方法来转化卷积特征映射,即时空正则化和通道正则化。

我们提的特征的优点:1)能够自动的学习得到高可区分性的特征,2)考虑了时间维的本质特性,引进了轨迹控制策略来采样和pooling深度学习的特征。

改进的轨迹:首先,在8个不同的空间尺度上,用步长为5个像素的格子,密集采样一系列的点。然后,这些被采样的点被密集的光流区域的均值滤波器跟踪。最后,这些缺乏运动信息的静态轨迹被删除,其他有巨大变化的轨迹也被忽略,因为他们是明显的不正确的光流。

改进的轨迹能够促进密集轨迹的识别的性能,因为他考虑了相机的运动信息。我们对改进的轨迹做了一点点的改变。我们只跟踪原始空间尺度上的点的轨迹。我们发现在单个尺度上能够比较快速的实现。

深度卷积描述子:
(1)卷积网络:我们选择的是two-stream ConvNet,因为他的性能不错。我们做出了一点点的改进,我们使用相同的网络结构,原始的网络在时间网络上忽略了第二层上的局部响应正则化(LRN),我们加上了。
(2)卷积特征映射:一旦两路的卷积网络训练完成,我们把它看做是一般的特征提取器来得到视频的卷积特征映射。对于每一帧,我们都把他看作是空间网络和时间网络的输入。我们对空间网络和时间网络做出了两点的改变:第一,我们删除了特征提取目标层后面的所有层。第二,在每一个卷积或者pooling层之前,对每一层做一个0填充。

轨迹池化的描述子:从提取的轨迹和卷积特征映射中得到trajectory-pooled deep-convolutional descriptory(TDDs)。
提取TDD包括两个步骤:特征映射正则化和轨迹池化。
我们设计了两种正则化的方法:时空正则化和通道正则化。我们选择时空正则化。
基于轨迹和正则化后的卷积特征映射来提取TDDs。
多尺度的TDD提取:我们在一个单一的尺度上计算光流和跟踪点,然后我们用多尺度的金字塔表示视频的帧和光流。

特征编码:我们选择Fisher vector来编码TDDs。然后用一个线性的SVM做分类器。为了训练GMMs,我们首先用PCA来对TDD去耦合,减少他的维度。

原文转自:http://blog.csdn.net/lk798362252/article/details/48243657

0

这篇关于Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/447078

相关文章

Unable to instantiate Action, goodsTypeAction, defined for 'goodsType_findAdvanced' in namespace '/

报错: Unable to instantiate Action, goodsTypeAction,  defined for 'goodsType_findAdvanced' in namespace '/'goodsTypeAction......... Caused by: java.lang.ClassNotFoundException: goodsTypeAction.......

用ajax json给后台action传数据要注意的问题

必须要有get和set方法   1 action中定义bean变量,注意写get和set方法 2 js中写ajax方法,传json类型数据 3 配置action在struts2中

使用http-request 属性替代action绑定上传URL

在 Element UI 的 <el-upload> 组件中,如果你需要为上传的 HTTP 请求添加自定义的请求头(例如,为了通过身份验证或满足服务器端的特定要求),你不能直接在 <el-upload> 组件的属性中设置这些请求头。但是,你可以通过 http-request 属性来自定义上传的行为,包括设置请求头。 http-request 属性允许你完全控制上传的行为,包括如何构建请求、发送请

Deep Ocr

1.圈出内容,文本那里要有内容.然后你保存,并'导出数据集'. 2.找出deep_ocr_recognition_training_workflow.hdev 文件.修改“DatasetFilename := 'Test.hdict'” 310行 write_deep_ocr (DeepOcrHandle, BestModelDeepOCRFilename) 3.推理test.hdev

Neighborhood Homophily-based Graph Convolutional Network

#paper/ccfB 推荐指数: #paper/⭐ #pp/图结构学习 流程 重定义同配性指标: N H i k = ∣ N ( i , k , c m a x ) ∣ ∣ N ( i , k ) ∣ with c m a x = arg ⁡ max ⁡ c ∈ [ 1 , C ] ∣ N ( i , k , c ) ∣ NH_i^k=\frac{|\mathcal{N}(i,k,c_{

Flink整合Oozie Shell Action 提交任务带Kerberos认证

最近这段时间一直在忙新集群迁移,上了最新的cdh6.3.0 于是Flink 提交遇到了许多的问题,还好有cloudera License 有了原厂的帮助和社区的伙伴,问题解决起来快了不少。 集群具体情况是 CDH6.3.0 Flink1.8.1,整个数据平台全部组件都上了kerberos和ldap因为要过认证,所以任务提交方法我们选择统一Oozie提交任务,并且因为kerberos认证,还需要F

Convolutional Neural Networks for Sentence Classification论文解读

基本信息 作者Yoon Kimdoi发表时间2014期刊EMNLP网址https://doi.org/10.48550/arXiv.1408.5882 研究背景 1. What’s known 既往研究已证实 CV领域著名的CNN。 2. What’s new 创新点 将CNN应用于NLP,打破了传统NLP任务主要依赖循环神经网络(RNN)及其变体的局面。 用预训练的词向量(如word2v

Servlet mapping specifies an unknown servlet name Action

看一下web.xml中<servlet-mapping>有没有配错

REMEMBERING HISTORY WITH CONVOLUTIONAL LSTM FOR ANOMALY DETECTION——利用卷积LSTM记忆历史进行异常检测

上海科技大学的文章,上海科技大学有个组一直在做这方面的工作,好文章挺多的还有数据集。 ABSTRACT 本文解决了视频中的异常检测问题,由于异常是无界的,所以异常检测是一项极具挑战性的任务。我们通过利用卷积神经网络(CNN或ConvNet)对每一帧进行外观编码,并利用卷积长期记忆(ConvLSTM)来记忆与运动信息相对应的所有过去的帧来完成这项任务。然后将ConvNet和ConvLSTM与

Introduction to Deep Learning with PyTorch

1、Introduction to PyTorch, a Deep Learning Library 1.1、Importing PyTorch and related packages import torch# supports:## image data with torchvision## audio data with torchaudio## text data with t