本文主要是介绍VALSE2019后,我们收获了什么?| 爱莫分享会,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
第九届视觉与学习青年学者研讨会(Vision And Learning SEminar, VALSE)于2019年4月11日—14日在合肥市大湖名城成功举办并顺利落幕。
爱莫小分队在听完88场精彩学术报告、多场论文Poster、37篇论文的Spotlight宣讲、137个Demo系统的精彩展示后,收获颇丰,带着意犹未尽的感觉踏上返程。
领略完学术华尔兹风采后,爱莫特派算法大神@ jianan为大家分享此行收获以及自己的学术见解。
「技术分享内容」
此次分享分别从检测、跟踪、行为识别和行人重识别四个方面对计算机视觉进行了分析。
一、检测
检测主要面临问题:小物体、正负样本比失衡、遮挡、速度等问题,造成对目标的检测失败或无法识别。@ jianan 主要分析了两种解决方法:
1、Two-stage: 先做region proposal,再做class/regression/mask等
2、One-stage: 不需要region proposal阶段,直接产生物体的类别概率和位置坐标值,速度快。
深入了解请戳:检测
二、跟踪
@ jianan分析了关于单目标跟踪和多目标跟踪的问题和解决方法。
也提出了新的疑问:
跟踪目标的运动预测和相似度判别,即如何准确的区分每一个目标?
跟踪目标之间的交互和遮挡处理如何做?
跟丢目标再次出现时,如何进行再识别?
深入了解请戳:跟踪
三、行为识别
如何准确判断和识别人体行为,比如在打斗识别当中,被一拳击倒在地,和幸福的倒在床上,其面画本质上没有区别,模型可能能看到人这个运动主体,但它并不知道其interact的对象是ground还是bed,是和朋友打闹中躺下还是被恶意击倒。
深入了解请戳:行为识别
四、行人再识别
行人重识别一般包括行人检测(person detection), 行人跟踪 (person tracking) 和行人查询 (person retrieval) 几个流程。
因为行人出现在摄像头时会有不同的朝向、拍摄视角、分辨率、清晰度,还有不同程度的遮挡,造成了同一个identity的图像差异巨大,使得再识别难度很大。
深入了解请戳:行人再识别
「水果time」
分享的过程不应全是严肃,它因为水果的加入更多了一些生动。
贯彻了公司每日的下午茶福利,与技术分享会融合,既是对一天紧张工作的情绪释放,也是另一种有趣的学习过程。
交流过程中,@ jianan认真地将自己对算法的一些见解向我们阐述,让不同岗位的同事更深层次地了解了算法的奥妙。
「写在最后」
每年的VALSE大会对参与者来说是新思路的开拓,但想要真正走出属于自己的道路还得依靠自身的探索。
在吸收各路大咖的经验之后,爱莫的小伙伴吸收了其中的精华,并融入了自己的见解,能更快地开辟出一条属于爱莫自己的人工智能之路。
这篇关于VALSE2019后,我们收获了什么?| 爱莫分享会的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!