VALSE学习(十八):复杂视频的深度高效分析与理解方法

2024-03-28 06:58

本文主要是介绍VALSE学习(十八):复杂视频的深度高效分析与理解方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

VALSE2019  中科院乔宇老师

一、论文主题

在报告中,乔老师首先回顾了深度网络的结构演化AlexNet、GoogLeNe、VGGNet、ResNet、DenseNet,给出深度网络发展的几个重要方法:

  • 优化(optimization),主要包括ReLu、Batch Normalization、Stage-wise training(or better initialization)、Identity Connection in ResNet.

  •  过拟合overfitting,包括Dropout,Data Argumentation

  •  结构设计Architecture Design,包括3×3 Layer in VGG,Inception Module以及ResNet Block

  • 轻量级Light parameter,包括3×3 Conv in VGG,1×1 Conv+Bottleneck。

乔老师作为国内视频行为识别的大佬,分享了自己视觉生涯的三个阶段,其谈到CV是一个长期充满挑战且十分具有前景的研究领域,希望广大学生脚踏实地的做研究。在第一阶段的山脚(~2011年),主要采用传统方法去处理视觉的难题(检测、分割等),效果不如人意;在第二阶段的爬坡期(2012年后的深度学习),深度学习方法极大地推动了视觉各项任务的发展;在第三阶段的登顶期(未来),将朝着超级视觉去发展(本人理解为多模态融合的视觉技术)。

 

随后,乔老师分享了人脸检测(MTCNN、ICC-CNN)和人脸识别的一些工作。重点从人脸识别的loss发展进行了分享,从早期的softmax Loss、Contrastive Loss、Tripetloss、Center loss的系列改进。

 

在视频行为识别与理解方面,乔老师分享了一系列他们实验室的工作,包括:2013年的视频中层表示与结构模型、2014年的轨迹卷积特征TPD以及视频特征编码学习、2016年的运动向量网络EMV-CNN和时序分割模型TSN,以及2017年后的姿态递归注意网络RPAN和非监督强化视频概要。

 

这篇关于VALSE学习(十八):复杂视频的深度高效分析与理解方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/854808

相关文章

Pytest多环境切换的常见方法介绍

《Pytest多环境切换的常见方法介绍》Pytest作为自动化测试的主力框架,如何实现本地、测试、预发、生产环境的灵活切换,本文总结了通过pytest框架实现自由环境切换的几种方法,大家可以根据需要进... 目录1.pytest-base-url2.hooks函数3.yml和fixture结论你是否也遇到过

resultMap如何处理复杂映射问题

《resultMap如何处理复杂映射问题》:本文主要介绍resultMap如何处理复杂映射问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录resultMap复杂映射问题Ⅰ 多对一查询:学生——老师Ⅱ 一对多查询:老师——学生总结resultMap复杂映射问题

鸿蒙中Axios数据请求的封装和配置方法

《鸿蒙中Axios数据请求的封装和配置方法》:本文主要介绍鸿蒙中Axios数据请求的封装和配置方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.配置权限 应用级权限和系统级权限2.配置网络请求的代码3.下载在Entry中 下载AxIOS4.封装Htt

如何高效移除C++关联容器中的元素

《如何高效移除C++关联容器中的元素》关联容器和顺序容器有着很大不同,关联容器中的元素是按照关键字来保存和访问的,而顺序容器中的元素是按它们在容器中的位置来顺序保存和访问的,本文介绍了如何高效移除C+... 目录一、简介二、移除给定位置的元素三、移除与特定键值等价的元素四、移除满足特android定条件的元

基于Python实现高效PPT转图片工具

《基于Python实现高效PPT转图片工具》在日常工作中,PPT是我们常用的演示工具,但有时候我们需要将PPT的内容提取为图片格式以便于展示或保存,所以本文将用Python实现PPT转PNG工具,希望... 目录1. 概述2. 功能使用2.1 安装依赖2.2 使用步骤2.3 代码实现2.4 GUI界面3.效

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

Redis实现延迟任务的三种方法详解

《Redis实现延迟任务的三种方法详解》延迟任务(DelayedTask)是指在未来的某个时间点,执行相应的任务,本文为大家整理了三种常见的实现方法,感兴趣的小伙伴可以参考一下... 目录1.前言2.Redis如何实现延迟任务3.代码实现3.1. 过期键通知事件实现3.2. 使用ZSet实现延迟任务3.3

基于Python和MoviePy实现照片管理和视频合成工具

《基于Python和MoviePy实现照片管理和视频合成工具》在这篇博客中,我们将详细剖析一个基于Python的图形界面应用程序,该程序使用wxPython构建用户界面,并结合MoviePy、Pill... 目录引言项目概述代码结构分析1. 导入和依赖2. 主类:PhotoManager初始化方法:__in

idea maven编译报错Java heap space的解决方法

《ideamaven编译报错Javaheapspace的解决方法》这篇文章主要为大家详细介绍了ideamaven编译报错Javaheapspace的相关解决方法,文中的示例代码讲解详细,感兴趣的... 目录1.增加 Maven 编译的堆内存2. 增加 IntelliJ IDEA 的堆内存3. 优化 Mave

Java String字符串的常用使用方法

《JavaString字符串的常用使用方法》String是JDK提供的一个类,是引用类型,并不是基本的数据类型,String用于字符串操作,在之前学习c语言的时候,对于一些字符串,会初始化字符数组表... 目录一、什么是String二、如何定义一个String1. 用双引号定义2. 通过构造函数定义三、St