本文主要是介绍CVPR 2015 Oral概览 - 第一天上午,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
第一天上午的两大主题:迅猛发展的深度学习和枝繁叶茂的3D摄像头。
D1-AM-A. CNN Architectures
【Hypercolumns for Object Segmentation and Fine-Grained Localizatio】
利用Hypercolumn进行目标分割和精细定位
(Ross Girshick, Jitendra Malik)
一个像素定义一个hypercolumn,表示vector of activations of all CNN units above that pixel.
分割结果既有高层语义,又精细。
给定BBOX,做目标分割。
给定BBOX,检测左手腕。
给定BBOX,分割头、躯干、腿、胳膊。
【Modeling Local and Global Deformations in Deep Learning: Epitomic Convolution, Multiple Instance Learning, and Sliding Window Detection】
深度学习中局部和全局形变的建模
(Google, INRIA)
传统DCNN用max-pooling对抗目标的平移和形变。
本文使用另一种方法:用epitomic(表率) convolution来模拟形变,用Multiple Instance Learning来学习不同位置和尺度。
这篇关于CVPR 2015 Oral概览 - 第一天上午的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!