本文主要是介绍赛道 | CVPR2021-MMAct挑战赛跨模态动作识别双冠方案解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
日前,计算机视觉和模式识别领域的三大顶级会议之一CVPR正在进行中,深兰DeepBlueAI团队在动作识别国际挑战赛 (ActivityNet) 研讨会上,参加了 MMAct 挑战赛中仅设的两个赛道——“跨模态裁剪动作识别”和“跨模态未裁剪动作时序定位”,并均以大比分领先取得第一。
竞赛要求参赛者提出跨模态视频动作识别/定位方法,以弥补使用 MMAct[1] 数据集的纯视觉方法的缺点。此任务的目标是利用基于传感器的,例如穿戴式传感器数据作为特权信息,以及基于视觉的模态,其方式可以克服训练(传感器 + 视频)和测试(仅视频)阶段之间模态差异所带来的限制。用于此竞赛的多模态数据包括:加速度、方向、陀螺仪、RGB 视频和人体关键点。
挑战赛促进了关于如何通过使用跨模态方法解决视觉挑战的另一种观点,希望扩大对视频动作理解的研究,以进一步利用日常使用的智能设备(例如智能手机)中的传感器。
值得一提的是,深兰科技作为连续三次问鼎CVPR的“常客”,凭借其高超的技术水平,更是在其他众多国际顶级大赛中一骑绝尘,至今在ICCV,ECCV, NeurIPS,KDD,ACL,NAACL等大赛中包揽多项冠军。
(CVPR获奖内容持续更新,敬请关注“深兰深延AI”微信公众号)
一、Cross-Modal Trimmed Action Recognitionÿ
这篇关于赛道 | CVPR2021-MMAct挑战赛跨模态动作识别双冠方案解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!